文章目录
一、简介
LeNet是LeCun在1998年提出,用于解决手写数字识别的视觉任务。一般认为,卷积神经网络是从这里开始的。LeNet5一共有七层。两个卷积,两个池化,三个全连接。
二、网络结构
这里的卷积就是正常卷积。
池化不太一样。按原文的意思,池化是2*2的池化, 不过不是平均或者最大池化。而只求和了,然后加上一个可以训练的偏置项,再用sigmod函数激活一下。
其它层的具体情况参见这个大佬写的经典论文之LeNet-5
三、代码实现 TODO
完全按照原论文实现的话很难,我现在不会。貌似按原论文那样效果也一般般。现在对LeNet的实现一般都是简化的。比如池化层直接就最大池化。第三个卷积层也不会整那么麻烦。
不过以后要是水平上来了还是会把这个实现补上。