VGG网络中测试时为什么全链接层改成卷积层

最新推荐文章于 2025-06-12 15:28:56 发布

行者无疆兮

最新推荐文章于 2025-06-12 15:28:56 发布

阅读量9.7k

点赞数 2

CC 4.0 BY-SA版权

分类专栏：深度学习计算机视觉文章标签： VGG 全链接层转化卷积层

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/qq_30159015/article/details/79710364

本文探讨了在VGG网络测试阶段，将全连接层转换为卷积层的原因。通过论证，揭示了这种方法能显著减少计算量，提高效率，尤其适合处理多个测试图像的位置应用。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

首先需要理解的是改fc层为conv层实际上的计算方式没有发生任何变化。但是其结果全卷积网络可以接收任意大小的图片输入，得到一个score map，对其做一个average就可以得到最终结果(one-hot label)。

之所以需要这样设计，因为他们train与test的图片大小是不一样的。

卷积层和全连接层的唯一区别在于卷积层的神经元对输入是局部连接的,并且同一个通道(channel)内不同神经元共享权值(weights). 卷积层和全连接层都是进行了一个点乘操作, 它们的函数形式相同. 因此卷积层可以转化为对应的全连接层, 全连接层也可以转化为对应的卷积层.

比如VGGNet[1]中, 第一个全连接层的输入是7*7*512, 输出是4096. 这可以用一个卷积核大小7*7, 步长(stride)为1, 没有填补(padding), 输出通道数4096的卷积层等效表示, 其输出为1*1*4096, 和全连接层等价. 后续的全连接层可以用1x1卷积等效替代.

简而言之, 全连接层转化为卷积层的规则是: 将卷积核大小设置为输入的空间大小.这样做的好处在于卷积层对输入大小没有限制, 因此可以高效地对测试图像做滑动窗式的预测.

比如训练时对224*224大小的图像得到7*7*512的特征, 而对于384*

最低0.47元/天解锁文章

200万优质内容无限畅学

评论 8

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

行者无疆兮 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。