ResNet 的文章有两篇:Deep Residual Learning for Image Recognition 和 Identity Mappings in Deep Residual Networks。这里仅仅关注三个问题:ResNet 解决了机器学习中的什么问题;ResNet 的代码怎么写的;ResNet 怎么用。至于文章中的性能研究和试验结果,就不做讨论了。
Deep Residual Learning for Image Recognition
ResNet 解决了 deep NN 的两大问题:1. deep NN 的梯度弥散和爆炸问题;2. deep NN 的精度随着模型的加深,会逐渐饱和不再上升,甚至会大幅度下降。
其理论基础在于:机器学习的目的是用一个任意复杂的函数 H(x) H ( x ) 来近似样本数据的分布。而这个任意复杂的函数 H(x) H ( x ) 可以由任意多的非线性单元来近似。如果将 H(x) H ( x ) 写为: H(x)

本文详细介绍了ResNet模型的原理和结构,包括解决深度学习中的梯度消失和性能饱和问题,以及ResNet 18/34和50/101/152的不同构建方式。通过PyTorch代码展示了ResNet的基本块和堆叠模块,同时讨论了网络参数初始化和输入图像预处理策略,如随机裁剪、归一化等。
最低0.47元/天 解锁文章
585





