VGG:VERY DEEP CONVOLUTIONAL NETWORKS FOR LARGE-SCALE IMAGE RECOGNITION论文笔记

VGG模型通过堆叠更多3×3卷积层,以增加深度,减小参数量,提高了图像识别性能。作者探讨了模型训练、预初始化策略以及多尺度训练对模型效果的影响,实验表明深度网络在分类和定位任务中表现出色,为后续深度学习研究奠定了基础。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

论文地址:Very Deep Convolutional Networks for Large-Scale Image Recognition

前言

VGG模型在ILSVRC2014上大放异彩,虽然从VGG的诞生到现在已经2年多,但是它依然是目前最热门的模型网络之一。它最大的贡献是,将深度学习从AlexNet的时代推入到deeper model的时代,第一次将模型深度提高到16层以上(当然还有同年的GoogLeNet),也使得在识别和定位等任务上的性能得到大幅度的提高,今天我们就来看看它到底是如何实现的吧。

思想

思想核心——模型深度。作者希望通过堆叠更多的卷积层来增加网络的深度,以提高模型的性能。但是如果只在原始的较浅层模型上简单的通过复制权重层来堆叠,势必会出现参数量过大,模型过复杂,模型的优化求解更难。因此,必须要改进。

改进

既然增加了模型的深度而又不想过分的增加计算复杂度,那就只有以平衡的角度,从模型的宽度着手。作者提出两个 3×3 卷积层的堆叠与一个 5×5 的卷积层具有相同的reception field,三个 3×3 卷积层的堆叠与一个 7×7

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值