卷积神经网络

最新推荐文章于 2025-05-07 09:58:42 发布

dianlun2372

最新推荐文章于 2025-05-07 09:58:42 发布

阅读量100

点赞数

文章标签：人工智能

原文链接：http://www.cnblogs.com/nevermoes/p/cnn.html

版权

本文深入解析卷积神经网络(CNN)，涵盖Relu激活函数、卷积层、池化层的基本原理及计算过程，阐述其在图像特征提取的优势，并介绍CNN的经典架构与训练方法。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

卷积神经网络(CNN)

卷积神经网络(CNN)

Relu激活函数

定义

不同于之前在全连接前馈神经网络中用到的sigmoid函数，这里我们要使用一个新的激活函数，也就是Relu激活函数：

\[f(x)= max(0,x)\]

图像如下：

意义

相对于sigmoid激活函数，Relu激活函数有几个优势：

速度快，只需要计算一个\(\max(0,x)\)。
减轻了梯度消失的问题，回忆一下计算梯度的公式：\(\nabla=\sigma'\delta x\)。这里的\(\sigma'\)是sigmoid函数的导函数，而且这个导函数最大值只能取到1/4。所以说每计算一个sigmoid函数的导函数，梯度都会越来越小，这对于深层神经网络来说会导致一个很致命的问题，也就是所谓的梯度消失问题。而Relu函数的导函数是1，不会导致梯度变小。
稀疏性，Relu函数在自变量取值小于等于0的时候是不激活的，而神经科学对大脑的研究也表明，大脑在工作的时候大约只有5%神经元是激活的。比起sigmod，使用Relu函数的神经网络激活率更低。

卷积层

这里要介绍的就是卷积神经网络中最重要的一个部分了，就是因为有了卷积层所以才叫卷积神经网络。

定义

卷积神经网络一般是用于图像处理，如果把图像的所有像素作为输入，那么这个输入数量和特征量是非常巨大的，卷积的核心思想就是通过一个过滤器把图像的特征抽取出来并降低输入数量。
下面来讲解一个具体的计算过程：

图中的各个图像的说明：

左边为image，即输入图像，大小为5*5。
中间为filter，即进行卷积操作的矩阵，大小为3*3。
右边为feature map，卷积操作后得到的特征矩阵，大小为3*3。

符号定义：

\(x_{i,j}\)表示image的\(i\)行\(j\)列元素。
\(w_{i,j}\)表示filter的\(i\)行\(j\)列权重。
\(a_{i,j}\)表示feature map的\(i\)行\(j\)列元素。
\(f\)表示激活函数

那么卷积的计算方法就是：

\[a_{i,j}=f(\sum_{m=0}^{2}\sum_{n=0}^{2}w_{m,n}x_{i+m,j+n}+w_b)\]

以\(a_0\)为例就是：

\[\begin{align} a_{0,0}&=f(\sum_{m=0}^{2}\sum_{n=0}^{2}w_{m,n}x_{m+0,n+0}+w_b)\\ &=relu(w_{0,0}x_{0,0}+w_{0,1}x_{0,1}+w_{0,2}x_{0,2}+w_{1,0}x_{1,0}+w_{1,1}x_{1,1}+w_{1,2}x_{1,2}+w_{2,0}x_{2,0}+w_{2,1}x_{2,1}+w_{2,2}x_{2,2}+w_b)\\ &=relu(1+0+1+0+1+0+0+0+1+0)\\ &=relu(4)\\ &=4 \end{align}\]

计算结果如下图：

整个卷积的计算过程可以看下面这个动画：

注意以上的的卷积计算过程做了两个重要的简化：

步幅(stride)1为1，步幅即filter每次移动的格数，步幅变大的话，feature map是会变小的。有关stride高度和宽度的两个公式：\[\begin{align}W_2 &= (W_1 - F + 2P)/S + 1\\H_2 &= (H_1 - F + 2P)/S + 1\end{align}\]其中\(P\)为Zero Padding就是在原image矩阵的周围填充的0。\(W_1\)和\(H_1\)为卷积前的高宽。
频道(channel)为1，即图像是有深度度，因为计算机中的图像一般是RGB来存储的，是三个颜色通道叠加的结果。如果channel不为1，卷积层的计算公式为：\[a_{i,j}=f(\sum_{d=0}^{D-1}\sum_{m=0}^{F-1}\sum_{n=0}^{F-1}w_{d,m,n}x_{d,i+m,j+n}+w_b)\]其中的D为深度，F为filter的大小，因为图像是方的，所以高宽一样。

下图就是完整卷积的计算过程了：

意义

在讲解卷积层计算的时候稍微提了一下卷积层意义，这里稍微详细地说明一下。
深度学习最大的意义便在于自动化的特征处理，因为只要网络够深，抽象能力足够强，是可以免于人工提取特征的。而卷积对于图像的特征的提取是非常有效的。这里强调一下，是针对图像而言的特征提取，对于其他领域可能并没那么好用。
还有另一方面是减少了参数个数，比如一个5*5的图像，如果全连接隐层有九个节点，那么权值的数量就是5*5*9个，而对于卷积层只有一个3*3的卷积矩阵而已。