深度神经网络(Deep Neural Network)

本文介绍了深度神经网络(DNN)的基本概念,包括矩阵维度、前向传播与反向传播过程、参数与超参数设置等内容,并通过人脸识别和语音识别的例子说明了深层表示的优势。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1. 矩阵的维度

DNN结构示意图如图所示:

对于第l层神经网络,单个样本其各个参数的矩阵维度为:
W[l](n[l],n[l1])
b[l](n[l],1)
dW[l](n[l],n[l1])
db[l](n[l],1)
Z[l](n[l],1)
A[l]=Z[l](n[l],1)

2. 为什么使用深层表示

人脸识别和语音识别:

对于人脸识别,神经网络的第一层从原始图片中提取人脸的轮廓和边缘,每个神经元学习到不同边缘的信息;网络的第二层将第一层学得的边缘信息组合起来,形成人脸的一些局部的特征,例如眼睛、嘴巴等;后面的几层逐步将上一层的特征组合起来,形成人脸的模样。随着神经网络层数的增加,特征也从原来的边缘逐步扩展为人脸的整体,由整体到局部,由简单到复杂。层数越多,那么模型学习的效果也就越精确。
对于语音识别,第一层神经网络可以学习到语言发音的一些音调,后面更深层次的网络可以检测到基本的音素,再到单词信息,逐渐加深可以学到短语、句子。
所以从上面的两个例子可以看出随着神经网络的深度加深,模型能学习到更加复杂的问题,功能也更加强大。
电路逻辑计算:

假定计算异或逻辑输出:
y=x1x2x3xn
对于该运算,若果使用深度神经网络,每层将前一层的相邻的两单元进行异或,最后到一个输出,此时整个网络的层数为一个树形的形状,网络的深度为O(log2(n)),共使用的神经元的个数为:
1+2++2log2(n)1=112log2(n)12=2log2(n)1=n1
即输入个数为n,输出个数为n-1。
但是如果不适用深层网络,仅仅使用单隐层的网络(如右图所示),需要的神经元个数为2n1个 。同样的问题,但是深层网络要比浅层网络所需要的神经元个数要少得多。

3. 前向和反向传播

首先给定DNN的一些参数:
L:DNN的总层数;
n[l]:表示第l层的包含的单元个数;
a[l]:表示第l层激活函数的输出;
W[l]:表示第l层的权重;
输入x记为a[0],输出ŷ 记为a[L]
前向传播(Forward propagation)
Input:a[l1]
Output:a[l]cache(z[l])
公式:
z[l]=W[l]a[l1]+b[l]a[l]=g[l](z[l])
向量化程序:
Z[l]=W[l]A[l1]+b[l]A[l]=g[l](Z[l])
反向传播(Backward propagation)
Input:da[l]
Output:da[l1]dW[l]db[l]
公式:
dz[l]=da[l]g[l](z[l])dW[l]=dz[l]a[l1]db[l]=dz[l]da[l1]=W[l]Tdz[l]
da[l1]dz[l],有:
dz[l]=W[l+1]Tdz[l+1]g[l](z[l])
向量化程序:
dZ[l]=dA[l]g[l](Z[l])dW[l]=1mdZ[l]A[l1]db[l]=1mnp.sum(dZ[l],axis=1,keepdims=True)dA[l1]=W[l]TdZ[l]

4. 参数和超参数

参数:
参数即是我们在过程中想要模型学习到的信息,W[l]b[l]
超参数:
超参数即为控制参数的输出值的一些网络信息,也就是超参数的改变会导致最终得到的参数W[l]b[l]的改变。
举例:
学习速率:α
迭代次数:N
隐藏层的层数:L
每一层的神经元个数:n[1]n[2],
激活函数g(z)的选择
### 回答1: 深度神经网络Deep Neural Network)是一种基于神经网络的机器学习模型,它由多个神经网络层组成,每一层都包含多个神经元。深度神经网络可以通过多次迭代训练来学习输入数据的特征,并用于分类、回归、图像识别、语音识别等领域。它是目前最先进的人工智能技术之一。 ### 回答2: 深度神经网络是现代机器学习和人工智能领域中最重要的概念之一。它是由多个神经网络层组成的神经网络结构,每一层都包含若干个单元。随着深度神经网络的层数不断增加,它可以逐渐学习到更加复杂的特征和规律,从而取得更加优秀的性能表现。 深度神经网络是一种基于前向反馈的人工神经网络,通常由输入层、若干个隐藏层和输出层组成。在每一层中,神经元会根据输入的数据向后传递信号进行计算和加权,最终输出结果。深度神经网络通过梯度下降算法对每一个神经元的权重和偏置进行微调,以最大化预测结果的准确性。 深度神经网络之所以能够取得惊人的表现,一方面是因为在每一层中使用了非线性激活函数,非常适合处理各种类型的数据。另一方面,更关键的是深度神经网络在训练过程中使用了反向传播算法,能够根据数据的真实标签对每一层的误差进行反向传播和修正,大大提升了训练效果。 深度神经网络已经在许多领域中广泛应用,如图像识别、语音识别、自然语言处理等。而随着技术的不断进步,深度神经网络仍将在未来的各种领域中发挥着越来越重要的作用。 ### 回答3: 随着人工智能技术的发展,深度神经网络Deep Neural Network/DNN)作为深度学习的代表,已经在图像识别、语音识别、自然语言处理等领域取得了重大突破,成为当今人工智能领域研究的热点之一。 深度神经网络是由多个神经网络层堆叠而成的模型,以层次化和分层抽象的方法将数据进行处理和分类,在计算机视觉领域中,深度神经网络的应用方向主要集中在三个方面:图像描述、目标检测和语义分割。 图像描述是指利用深度神经网络来分析图像内容并生成相应的文字描述,这对于机器自动化阅读图像、更好地理解图像语义有重要的价值; 目标检测则是指在图像中找出和定位特定目标的过程,例如在一组图片中找出其中的汽车、行人等; 语义分割是指将图像像素进一步分类,实现精细化的像素级别的图像分类和标注,这对于图像的更深入分析让计算机更好地理解图像的语义。 深度神经网络的成功离不开GPU计算的支持,家用计算机通过GPU加速,可以实现深度神经网络的训练和推断。同时,深度学习框架的应用也成为深度学习发展的推动力量之一,例如TensorFlow、PyTorch等深度学习框架大大降低了深度学习模型的实现难度,进一步推动了深度学习技术的发展。 总之,深度神经网络的发展,使计算机能够处理更加复杂的任务,这对人工智能技术的发展有着深远的历史意义。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值