- 定义:深度学习是机器学习的一个子集,主要使用多层神经网络来进行特征提取和学习。深度学习在处理图像、语音和自然语言处理等复杂任务时表现出色,在当今大数据和高性能计算的支持下,已经成为了近年来人工智能领域的核心技术之一。
一、深度学习的背景
-
神经网络的起源:神经网络是深度学习的基础,其灵感来源于人类大脑的神经元连接。最初的神经网络(感知器)是通过简单的数学模型模拟神经元(就是大脑的细胞)之间的连接。
二、深度学习的基本概念
-
人工神经网络(ANN):
- 神经元:基本的计算单元,通过加权输入信号、激活函数来输出结果,比如接收一个信息(文字、图片等),然后作出一个判断或决定(比如这是一只狗)。
- 层次结构:神经网络由多个“层”组成,通常分为输入层(从上一层接收信息)、隐藏层(转换和处理数据)和输出层(输出信息给下一层)。每一层的神经元都与上一层的神经元相连接。
- 权重和偏置:每个连接有一个权重,控制信号的强度,偏置用于调整模型的输出。
- 激活函数:激活函数决定了神经元的输出,常见的激活函数有Sigmoid、ReLU(Rectified Linear Unit)等。
- 人工神经网络是基础的