经典文章系列: (ResNet) Deep Residual Learning for Image Recognition 论文阅读

最新推荐文章于 2025-10-26 14:28:06 发布

原创

最新推荐文章于 2025-10-26 14:28:06 发布 · 1.5k 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

本文详细解析了ResNet残差网络的设计思想，包括解决深度学习中网络加深带来的退化问题，通过残差结构优化网络训练，以及实验结果展示残差网络在深度学习中的优势。此外，还讨论了不同维度匹配的残差结构实现方式。

核心思想

将层表示为学习残差函数。实验表明，残差网络更容易优化。解决了增加网络深度带来的副作用（退化问题），这样能够通过单纯地增加网络深度，来提高网络性能。

问题来源

增加网络深度的重要性

CNN能够提取low/mid/high-level的特征，网络的层数越多，意味着能够提取到不同level的特征越丰富。并且，越深的网络提取的特征越抽象，越具有语义信息。

简单增加网络深度存在的问题

梯度弥散或梯度爆炸
解决办法：正则化初始化和中间的正则化层（Batch Normalization），这样的话可以训练几十层的网络。
退化问题（degradation）
按照一般经验，只要网络不训飞，而且不过拟合，那应该是越深越好。但是有时会发现，网络加深了，accuracy却下降了，称这种情况为degradation。如下图所示：

怎么解释呢？是因为深度网络不能简单地被很好地优化，当模型变复杂时，SGD的优化变得更加困难，导致了模型达不到好的学习效果。
为了证实，作者做了一个实验，通过浅层网络+等同映射(y=x)构造深层模型，结果深层模型并没有比浅层网络有等同或更低的错误率。说明退化问题可能是因为深层的网络并不是那么好训练，也就是求解器很难拟合多层网络中的等同函数(y=x)。
既然学习等同映射比较麻烦，那干脆直接给它加上一个shortcut，直接给这个模块输出叠加上输入，即残差结构。

残差结构

这里写图片描述
残差结构通过前向神经网络+shortcut连接实现，输出由多个卷积层级联的输出和输入元

最低0.47元/天解锁文章

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。