博客: blog.shinelee.me | 博客园 | 优快云
写在前面
VGG(2014)网络出自paper《Very Deep Convolutional Networks for Large-Scale Image Recognition》,为ILSVRC2014 localization冠军和classification亚军方法(冠军为GoogLeNet),首次提交arXiv时间为2014年9月,后发表在ICLR2015,截止20191011引用量达27612。因为出自牛津大学Visual Geometry Group,所以网络被命名为VGG,根据层数不同,又分为VGG16、VGG19等。

论文的主要贡献:
- 探究了网络深度对性能的影响,通过叠加卷积层来增加深度,性能变好——“Our results yet again confirm the importance of depth in visual representations”。
- 只使用 3 × 3 3\times 3 3×3的卷积核,通过多个 3 × 3 3 \times 3 3×3卷积层叠加来获得与大卷积核相同的感受野,同时引入更多的非线性,减少了参数。若有 C C C个channel,3个 3 × 3 3\times 3 3×3的卷积层参数量为 3 ( 3 2 C 2 ) = 27 C 2 3(3^2C^2)=27C^2 3(32C2)=
深度解析:VGG网络中的3x3卷积优势

VGG14论文探讨了网络深度对性能的重要性,提出使用多个3x3卷积层替代大卷积核,减少参数量。通过实验,证明了深度增加、多尺度训练和测试能提升性能。VGG16和VGG19表现接近,且LRN层在实验中并未带来显著改善。
最低0.47元/天 解锁文章
356

被折叠的 条评论
为什么被折叠?



