VGG
论文《Very Deep Convolutional Networks for Large-Scale Image Recognition》
1. 设计思路
VGG通过增加卷积神经网络的深度来提高模型在图像分类的性能。
具体来讲,VGG通过在模型中增加更多的卷积层来增加模型的深度,需要注意的是VGG卷积层中所使用的都是较小的filter(3*3)。
通过多层较小filter的卷积层去替代一层较大filter的卷积层,可以在保证感受野(receptive field)不变的前提下,减少参数数量,引入更多的非线性因素,提高模型的深度,从而提升模型的分类性能。
2. 数据预处理
输入数据为resize为224*224的RGB图像。
对每张图片进行预处理:图像的每个像素值减去该像素RGB三通道像素值的平均值。
3. 模型结构
VGG模型提供了多种不同的配置,为了便于分析模型结构,将多个相连的卷积层作为一个VGG块。
整体上来看,VGG模型由5个VGG块(包括每个VGG块后的池化层)和三层全连接层组成。
VGG各配置中,卷积层和池化层的参数基本是一样的: