神经网络在反向传播过程中要不断地传播梯度,而当网络层数加深时,梯度在逐层传播过程中会逐渐衰减,导致无法对前面网络层的权重进行有效的调整。残差网络中,加入了short connections 为梯度带来了一个直接向前面层的传播通道,缓解了梯度的减小问题。从前后向信息传播的角度来看何恺明等人从前后向信息传播的角度给出了残差网路的一种解释:在前向传播时,输入信号可以从任意低层直接传播到高层。由于包含了一个天然的恒等映射,一定程度上可以解决网络退化问题。反向传播时,错误信号可以不经过任何中间权重矩阵变换直接传播到低层,一定程度上可以缓解梯度弥散问题(即便中间层矩阵权重很小,梯度也基本不会消失)。综上,可以认为残差连接使得信息前后向传播更加顺畅
残差网络为什么能做到很深层?
最新推荐文章于 2023-07-18 09:34:16 发布