李飞飞计算机视觉-自用笔记(四)
9 CNN框架
9.1 LeNet-5
使用步长为1,大小为5 * 5的卷积核;下采样(池化层)步长为2,大小为2 * 2
[CONV-POOL-CONV-POOL-FC-FC]
LeNet在数字识别领域取得了成功,这个模型主要有两个思想
1.卷积,它的特点是局部感知和参数共享。局部感知对应着提取局部特征,具有很好的平移等变性。共享参数可以防止过拟合。
2.下采样,叫做pooling,用的比较多的是max pooling
9.2 AlexNet
输入图像:227 * 227 * 3
CONV1:96个步长为4,大小为11 * 11的卷积核;通过公式计算(227-11)/4+1=55,故
第一个卷积层输出数据大小:[55 * 55 * 96]
参数个数:[11 * 11 * 3 * 96] = 35K
POOL1:步长为2,大小为3 * 3的卷积核;通过公式计算(55-3)/2+1=27,同时池