1.LeNet发展历史
- LeNet论文
- 1989年:Yann LeCun等人,结合反向传播算法的卷积神经网络来识别手写数字,并成功地用于识别手写邮政编码
- 1990年:他们的模型在美国邮政总局提供的邮政编码数字数据的测试结果表明,错误率仅为1%,拒绝率约为9%
- 1998年:他们将手写数字识别的各种方法在标准的手写数字识别基准上进行比较,结果表明他们的网络优于所有其他模型,经过多年的研究与迭代,最终发展成为LeNet-5
2.LeNet模型讲解
2.1LeNet主要部分
- 前半部分是卷积层和池化层
- 后半部分是全连接层
- Convolution——卷积
- Relu——激活
- Pooling——池化
2.2卷积层操作
- 关于卷积详细内容可以参考之前的文章(其中第5小节)
- 卷积过程就是计算机自己找到的一些特征,我们把他称为卷积核(如上图中间的3×3矩阵),依次作用于原始像素(上图左侧大的矩阵),对应位置相乘再相加,最后再除以卷积核的数量,得到输出结果,经过卷积操作后得到的特征图(上图右边的绿色矩阵)
2.3池化层操作
- 池化操作就是将输入每一个位置的矩阵,比如视野是2×2,那么我们就针对这4个数,进行池化,选取他们的最大值或者平均值,如果是平均值就是平均池化,最大值就是最大池化,然后得到该位置的输出,降低数据体的空间尺寸,减少网络中的参数,以达到减少计算资源的效果
2.4模型预测结果
-
得到参数较少,但是依旧能保持原始图像信息的特征图
(上图右边三个彩色图)
-
将得到的特征图进行展平处理,进入神经网络得到预测的概率,通过反向传播的方式,不断调整这些参数,以达到预测值和真实值接近的情况,完成网络的训练
-
最终得到0-9数字的时十分类的每种概率值,概率值最大的数字,即该手写数字
3.LeNet在线体验
链接: 在线体验手写数字识别卷积神经网络