卷积神经网络-全面图解-带你了解前向后向传播的所有细节(文末代码)

本文深入解析卷积神经网络的卷积层、下采样层、全连接层及softmax反向传播,附带纯Python实现的车标识别6分类网络代码。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

卷积神经网络-全面图解-带你了解前向后向传播的所有细节

综述

本文将会从基础的前馈神经网络入手,通过bp神经网络,引出卷积神经网络,并把专门的重点放在如何理解和实现卷积神经网络的卷积层、下采样层、全连接层、以及最终的softmax的反向传播的理解。最后实现基于python的车标识别6分类网络

(代码:实现了 卷积、全连接、下采样等等前向、反向传播,将6类车标作为输入进行模型训练,不过是CPU版本的https://github.com/LonglongaaaGo/CNN_python 纯python实现的6分类网络,有问题可以联系我~
欢迎star 欢迎互粉

 

 

 

 

推导分析:

矩阵分析链接:https://blog.youkuaiyun.com/Willen_/article/details/87912967

首先:对X 求导时,对应的Z 表示的是 以向量X 为自变量,以Z 向量为应变量的函数关系有  Z =  f(X) ,所以可以直接带入矩阵求导公式(5.1.20)得出结果。

其次,对W求导时,对应的Z表示的是以 矩阵W 为自变量,以Z向量为因变量的函数关系,有 Z = f(W),但是没有直接的公式可以用(链接公式 5.1.26),只有正对输出为标量,输入为向量的实质求导公式,所以在这里做一下拆分就可以推出结果。

其中l代表第l层

j表示第j个卷积核

Mj 表示对应的通道数量

i 表示第i个通道

ps: 这里A的上标应该是l  不是i 打错了

 

这里应该还有一个求和在最左边,因为这里有k个卷积核,都要相应的计算进去

这里需要解释一下,

其中, 是上层卷积层输出 经过下采样之后的输出结果。

在CNN反向传播时,对于 [8],将其还原到池化层之前的大小。同时本实验是基于Max下采样,将 中的值移动到前向传播时池化操作之每一个子矩阵原先最大的位置。其中upsample( )表示一个上采样操作,若下采样因子为 m, 则通过上采样,将第l-1层的每个像素在水平和垂直方向上扩充m个像素, 于是就可以对应的计算从 l-1层的灵敏度上采样成卷积层 l 的灵敏度大小。 

这个灵敏度也可以理解为梯度,也就是说对于 l-1 层的梯度的计算,只要把l层的梯度进行上采样,还原原来的形状大小就可以了。

 

这里的激活层的反向传播都是很好计算的,求导求一下就好了,并且是维度是不变的,所以很好理解

 

 

 

 

代码:实现了 卷积、全连接、下采样等等前向、反向传播,将6类车标作为输入进行模型训练,不过是CPU版本的https://github.com/LonglongaaaGo/CNN_python 纯python实现的6分类网络,有问题可以联系我~
欢迎star 欢迎互粉 

卷积神经网络(CNN)专栏收录该内容2 篇文章订阅专栏 本文详细介绍了卷积神经网络(CNN)的基础概念和工作原理,包括输入层、卷积层、池化层、全连接层和输出层的作用。通过举例和图解,阐述了CNN如何处理图像,提取特征,以及如何进行手写数字识别。此外,讨论了池化层的平移不变性和防止过拟合的重要性。摘要由优快云通过智能技术生成文章目录言一、什么是卷积神经网络二、输入层三、卷积层四、池化层五、全连接层六、输出层七、回顾整个过程总结言  本文总结了关于卷积神经网络(CNN)的一些基础的概念,并且对于其中的细节进行了详细的原理讲解,通过此文可以十分全面的了解卷积神经网络(CNN),非常适合于作为Deep Learning的入门学习。下面就是本篇博客的全部内容!一、什么是卷积神经网络  卷积神经网络(Convolutional Neural Networks, CNN)这个概念的提出可以追溯到二十世纪80~90年代,但是有那么一段时间这个概念被“雪藏”了,因为当时的硬件和软件技术比较落后,而随着各种深度学习理论相继被提出以及数值计算设备的高速发展,卷积神经网络得到了快速发展。那究竟什么是卷积神经网络呢?以手写数字识别为例,整个识别的过程如下所示:图1:手写数字识别过程  以上过程就是识别手写数字的全部过程,这个项目我之也写过相关博客并开源了代码,感兴趣的同学可查阅: 基于CNN的MINIST手写数字识别项目代码以及原理详解。话说回来,可以看到整个过程需要在如下几层进行运算:输入层:输入图像等信息卷积层:用来提取图像的底层特征池化层:防止过拟合,将数据维度减小全连接层:汇总卷积层和池化层得到的图像的底层特征和信息输出层:根据全连接层的信息得到概率最大的结果  可以看到其中最重要的一层就是卷积层,这也是卷积神经网络名称的由来,下面将会详细讲解这几层的相关内容。二、输入层  输入层比较简单,这一层的主要工作就是输入图像等信息,因为卷积神经网络主要处理的是图像相关的内容,但是我们人眼看到的图像和计算机处理的图像是一样的么?很明显是不一样的,对于输入图像,首先要将其转换为对应的二维矩阵,这个二位矩阵就是由图像每一个像素的像素值大小组成的,我们可以看一个例子,如下图所示的手写数字“8”的图像,计算机读取后是以像素值大小组成的二维矩阵存储的图像。
03-12
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值