VGG：VERY DEEP CONVOLUTIONAL NETWORKS FOR LARGE-SCALE IMAGE RECOGNITION论文笔记

最新推荐文章于 2025-10-11 08:35:11 发布

原创

最新推荐文章于 2025-10-11 08:35:11 发布 · 4.4k 阅读

·

4

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

VGG模型通过堆叠更多3×3卷积层，以增加深度，减小参数量，提高了图像识别性能。作者探讨了模型训练、预初始化策略以及多尺度训练对模型效果的影响，实验表明深度网络在分类和定位任务中表现出色，为后续深度学习研究奠定了基础。

论文地址：Very Deep Convolutional Networks for Large-Scale Image Recognition

前言

VGG模型在ILSVRC2014上大放异彩，虽然从VGG的诞生到现在已经2年多，但是它依然是目前最热门的模型网络之一。它最大的贡献是，将深度学习从AlexNet的时代推入到deeper model的时代，第一次将模型深度提高到16层以上（当然还有同年的GoogLeNet），也使得在识别和定位等任务上的性能得到大幅度的提高，今天我们就来看看它到底是如何实现的吧。

思想

思想核心——模型深度。作者希望通过堆叠更多的卷积层来增加网络的深度，以提高模型的性能。但是如果只在原始的较浅层模型上简单的通过复制权重层来堆叠，势必会出现参数量过大，模型过复杂，模型的优化求解更难。因此，必须要改进。

改进

既然增加了模型的深度而又不想过分的增加计算复杂度，那就只有以平衡的角度，从模型的宽度着手。作者提出两个 $3 \times 3$ 卷积层的堆叠与一个 $5 \times 5$ 的卷积层具有相同的reception field，三个 $3 \times 3$ 卷积层的堆叠与一个 7×7

最低0.47元/天解锁文章

评论 1

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

查看更多评论

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。