VGG
论文《Very Deep Convolutional Networks for Large-Scale Image Recognition》
1. 设计思路
VGG通过增加卷积神经网络的深度来提高模型在图像分类的性能。
具体来讲,VGG通过在模型中增加更多的卷积层来增加模型的深度,需要注意的是VGG卷积层中所使用的都是较小的filter(3*3)。
通过多层较小filter的卷积层去替代一层较大filter的卷积层,可以在保证感受野(receptive field)不变的前提下,减少参数数量,引入更多的非线性因素,提高模型的深度,从而提升模型的分类性能。
2. 数据预处理
输入数据为resize为224*224的RGB图像。
对每张图片进行预处理:图像的每个像素值减去该像素RGB三通道像素值的平均值。
3. 模型结构
VGG模型提供了多种不同的配置,为了便于分析模型结构,将多个相连的卷积层作为一个VGG块。
整体上来看,VGG模型由5个VGG块(包括每个VGG块后的池化层)和三层全连接层组成。

VGG各配置中,卷积层和池化层的参数基本是一样的:
| 参数 | 值 |
|---|---|
| conv_filter_size |

VGG网络通过增加深度提升图像分类性能,采用多层3x3小filter卷积层代替大filter,减少参数并引入更多非线性。1x1卷积层用于增加深度而不改变空间维度。模型训练使用mini-batch梯度下降,并结合L2正则化、Dropout和数据增强防止过拟合。
最低0.47元/天 解锁文章
145

被折叠的 条评论
为什么被折叠?



