如何用Vgg-16神经网络训练cifar-10
由于vgg-16的输入是224* 224* 3,而cifar-10的输入是32* 32* 3(经转换后得到的)故应该对vgg-16模型进行修改
vgg-16架构
训练输入:固定尺寸224* 224的RGB图像。
预处理:每个像素值减去训练集上的RGB均值。
卷积核:一系列3* 3卷积核堆叠,步长为1,采用padding保持卷积后图像空间分辨率不变。
空间池化:紧随卷积“堆”的最大池化,为2*2滑动窗口,步长为2。
全连接层:特征提取完成后,接三个全连接层,前两个为4096通道,第三个为1000通道,最后是一个soft-max层,输出概率。所有隐藏层都用非线性修正ReLu
对应cifar-10的vgg-16模型参数
这里我们只采用A方法,共11层
由于224* 224* 3的图像第一层的卷积核个数为64,所以等比缩放后32* 32* 3的图像第一层卷积核个数为16。
同理,后面第2,3,4,5层卷积核个数分别为32,64,128,128
由于vgg-16标准模型输出大小为1000,而cifar-10输出大小为10,所以将全连接三层分别设为100,40,10