一、ResNet
论文:Deep Residual Learning for Image Recognition
ResNet网络中的亮点:
- 超深的网络结构(突破1000层)
- 提出residual模块
- 使用Batch Normalization加速训练(丢弃dropout)
论文中提到,简单的堆叠卷积层与池化层并不能降低错误率,通过堆叠卷积层与池化层,会带来梯度消失或梯度爆炸、退化问题。
ResNet不同的网络结构的错误率如下所示:
网络中残差结构如下所示:
主分支与shortcut的输出特征矩阵shape必须相同。
不同层数的ResNet网络结构对比如下: