1.原理
重点:
两条路径
- main path
- short cut/skip connection
总之,中间的网络层至少不会使得情况更坏,顶多没学,就是恒等。
幸运的话,performance更好。
2. 应用
1. ResNet-18
2. ResNet-50
相同:
- 一个模块内,只有内外(main path, short cut)各一个stride=2的存在,即一个33/2 一个 11/2都是为了图片大小降维。
不同
- 18中的2个33的卷积核变成了11 + 33 + 11
- 最后输出的前一层通道数要4倍化
3. 附录代码
1.Bottle-Neck
深入浅出pytorch 从模型到源码