论文精读——ResNet （Deep Residual Learning for Image Recognition）残差网络

两颗泡腾片

已于 2024-07-17 20:59:43 修改

阅读量3.5k

点赞数 38

分类专栏：论文精度系列笔记文章标签：深度学习分类 python 算法

于 2024-07-17 20:41:09 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/qq_46555222/article/details/140347283

版权

一、ResNet解决的问题

在公共数据集打榜结果可以看出，图像分类问题中，往往是越深的网络取得的成绩越好。在深度重要性的驱动下，一个问题产生了：学习更好的网络就像堆叠更多层一样容易吗？结果显然是NO。
深层网络面临最大的问题就是梯度消失或者梯度爆炸问题，二者从一开始就阻碍了收敛，但是这个问题在很大程度上已经通过归一化初始化和中间归一化层来解决。
于是分别进行不同深度网络的训练和测试发现更深层的网络更易出现精度饱和后迅速降级的现象，我们称这种现象为——退化，并且发现退化产生的原因不是过度拟合，而是层数变多引起的训练误差更高，随之测试误差也会更高。
现存的解决方法是Identity Mapping（恒等映射）,这种结构理论上来说深层网络结构相比于浅层网络不会产生更多的误差，但是实验表明并非如此。
这个概念出自论文Identity Mapping in Deep Residual Networks这篇论文也主要分析的是resnet中使用identity mapping效果好的原因。

使用skip connect的原因

在深度学习中，网络越深表达能力越强，性能越好。但随着网络深度的加深，一些其他的问题也会产生，比如梯度消失，梯度爆炸，解决这些问题也有一些方法，比如BN层，Relu等各种激活函数，这些方法的改善能力有限。
如上图所示就是论文中的resnet网络的skip block的示意图。我们可以使用一个非线性变化函数来描述一个网络的输入输出，即输入为X，输出为F(x)，F通常包括了卷积，激活等操作。
当我们强行将一个输入添加到函数的输出的时候，虽然我们仍然可以用G(x)来描述输入输出的关系，但是这个G(x)却可以明确的拆分为F(x)和X的线性叠加。这就是skip connect的思想，将输出表述为输入和输入的一个非线性变换的线性叠加，没用新的公式，没有新的理论，只是换了一种新的表达。它解决了深层网络的训练问题。

几个关键问题

ResNet的核心思想

上面我们说到深层网络并不是我们想的一定比浅层网络产生更好的效果。下面是ResNet的核心Idea:

假如有一个最完美网络N，那么相比于这个网络，我们所训练的网络一定有一些层是多余(不起作用或者起反作用)的，如果处理好这些冗余的层，我们的网络是不是就可以无限接近N了。

所以ResNet提出了恒等映射的概念，就是将这些冗余层恒等映射，（我理解的）分

最低0.47元/天解锁文章

两颗泡腾片

博客等级

码龄5年

6
原创

96
点赞

100
收藏

50
粉丝

关注

私信

热门文章

分类专栏

论文精度系列 2篇
笔记 3篇

展开全部收起

最新评论

论文精读——ResNet （Deep Residual Learning for Image Recognition）残差网络
偲怡: 讲的很好，这下都看懂了
BIRCH(平衡迭代规约和层次聚类）学习笔记
LSK_1015: 又学上了是吧
C++链接MySQL使用
优快云-Ada助手: 恭喜您写了第三篇博客！标题“C++链接MySQL使用”听起来非常有趣。您在C++和MySQL方面的知识一定很丰富。感谢您分享这个主题，这对我们这些对C++和数据库操作有兴趣的读者来说将会非常有帮助。我想，对于下一步的创作建议，您可以考虑分享一些实际案例，例如使用C++链接MySQL完成具体的项目或解决实际问题。这样的实用案例能够更好地帮助读者理解和应用您所分享的知识。当然，这只是一个建议，您可以根据自己的兴趣和专业知识进行选择。再次感谢您的持续创作，期待您未来更多精彩的博客！优快云正在通过评论红包奖励优秀博客，请看红包流：https://bbs.youkuaiyun.com/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3
C++ Opencv图像处理学习
优快云-Ada助手: 恭喜您写了第四篇博客！标题为“C++ Opencv图像处理学习”，我真的很高兴看到您在这个领域的持续努力和创作。对于学习图像处理，我相信您已经取得了很大的进步。接下来，我建议您可以尝试探索更多关于Opencv的高级技术和应用，比如目标检测或图像识别等。这些领域具有挑战性，但也会给您带来更多的成就感和学习机会。期待您的下一篇博客，继续加油！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.youkuaiyun.com/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5
Python基础学习看这个就够了(未完结）
两颗泡腾片: 🚶🏿

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。