ResNet 网络学习笔记

最新推荐文章于 2025-03-31 16:21:59 发布

原创

最新推荐文章于 2025-03-31 16:21:59 发布 · 402 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

一. 背景

网络的结构越深，提取的特征越抽象，越具有丰富的语义信息。但是随着网络的加深，会存在梯度弥散或者梯度爆炸等问题（之前的解决方案是引入BN层（可以看成一种正则化的方式））。几十层的网络训练引入BN正则化能得到解决梯度问题，但是会引入网络“退化”问题，退化问题指的是：网络层数增加，但是在训练集上的准确率却饱和甚至下降了.

二. 怎么解决退化问题？–》残差块

残差块打破了传统的神经网络n-1层的输出只能给n层作为输入的惯例，使某一层的输出可以直接跨过几层作为后面某一层的输入，其意义在于为叠加多层网络而使得整个学习模型的错误率不降反升的难题提供了新的方向。

残差块构成的网络叫残差网络：
在这里插入图片描述

没有残差块的网络叫做“plain network”，“plain network” 与 "resnet network"随着层数增加精度的变化如下图所示：
在这里插入图片描述

shortcut connections 是实线（相加的维度一样），有的是虚线（相加的维度不一样，主要体现在filter个数不一样）：

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。