ResNet解读

本文详细解读ResNet网络,探讨其提出的背景、解决的梯度消失问题,以及ResNet块的设计。文章通过分析ResNet-18的结构,展示了在不同维度和特征图尺寸变化时如何处理残差连接。最后,讨论了torchvision中ResNet-18的实现细节。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

ResNet是由2015年的论文:Deep Residual Learning for Image Recognition提出,现在在深度学习网络中应用越来越广泛。

ResNet

提出背景就是深层神经网络训练困难的问题,究其原因主要是因为梯度消失/爆炸,导致模型难以收敛,尽管batch normalization的使用可以使几十层的网络使用SGD算法训练收敛,但是更深的网络就没办法了。就算能收敛,也还是存在模型性能退化的问题,模型误差不降反升。
在这里插入图片描述
为了解决这个问题,论文作者提出残差结构,让网络不去直接拟合目标函数H(x),而是去拟合它的残差F(x)=H(x)-x,结构如下图:
在这里插入图片描述
这种结构可以较好的解决梯度消失的问题。梯度消失产生的原因就是在误差反向传播过程中,每一层都要乘以该层激活函数的导数,对于sigmoid型激活函数,其导数始终小于等于1的,所以反向传播过程中误差越来越小,梯度也越来越小,参数也就越来越难更新。当然,ReLU激活函数其在x>0的部分导数为1,可以一定程度上缓解梯度消失问题。
说完梯度消失,再来看残差结构,其在求梯度时会有一个常数项存在,就不存在梯度消失的问题了,如下图(图片源于博

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值