LeNet,它是最早发布的卷积神经网络之一,这个模型是识别图像中的手写数字。
论文:Gradient-Based Learning Applied to Document Recognition
年份:1998
一、模型简介:
LeNet是一个七层的网络。不包括输入层,输入层的图片是32*32大小。包括有两个卷积层,标记为C;两个池化层,标记为S;三个全连接层,标记为F。
模型的简化图:
网络所采用的激活函数是sigmoid函数。
与卷积核卷积后输出的图片大小计算方式:(输入的尺寸 - 卷积核的尺寸) / 卷积的步长 +1。卷积的步长(stride)表示卷积核每次移动的步数,在不做说明的情况下,移动的步数默认为1。
二、层详细介绍
1、C1卷积层
(1)图片变化
这个是网络的第一层,第一次卷积运算。采用的是6个5*5的卷积核,会得到六个feature map,feature map的大小是(32-5)/ 1 + 1 = 28。所以经过第一层卷积后得到的是6个28*28的特征图。