博客: blog.shinelee.me | 博客园 | 优快云
写在前面
VGG(2014)网络出自paper《Very Deep Convolutional Networks for Large-Scale Image Recognition》,为ILSVRC2014 localization冠军和classification亚军方法(冠军为GoogLeNet),首次提交arXiv时间为2014年9月,后发表在ICLR2015,截止20191011引用量达27612。因为出自牛津大学Visual Geometry Group,所以网络被命名为VGG,根据层数不同,又分为VGG16、VGG19等。
论文的主要贡献:
- 探究了网络深度对性能的影响,通过叠加卷积层来增加深度,性能变好——“Our results yet again confirm the importance of depth in visual representations”。
- 只使用 3 × 3 3\times 3 3×3的卷积核,通过多个 3 × 3 3 \times 3 3×3卷积层叠加来获得与大卷积核相同的感受野,同时引入更多的非线性,减少了参数。若有 C C C个channel,3个 3 × 3 3\times 3 3×3的卷积层参数量为 3 ( 3 2 C 2 ) = 27 C 2 3(3^2C^2)=27C^2 3(32C2)