Pytorch：卷积神经网络-ResNet

原创

已于 2022-02-13 17:22:58 修改

· 1.1k 阅读

2 ·

版权

文章标签：

#pytorch #cnn #深度学习 #计算机视觉 #神经网络

于 2022-02-04 00:28:49 首次发布

本文详细介绍了ResNet残差网络的工作原理、动机、网络结构，包括Bottleneck模块的实现和整个网络的搭建过程。通过实例演示，展示了如何在PyTorch中构建和应用ResNet，以解决深度网络训练中的梯度消失问题。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Pytorch: 残差网络-ResNet

Copyright: Jingmin Wei, Pattern Recognition and Intelligent System, School of Artificial and Intelligence, Huazhong University of Science and Technology

Pytorch教程专栏链接

文章目录

Pytorch: 残差网络-ResNet

@[toc]

Reference

残差网络(ResNet)

主要贡献

动机

Residual 块

网络结构

总结

代码实现

残差块实现

网络实现，将残差块和其他块连接起来

本教程不商用，仅供学习和参考交流使用，如需转载，请联系本人。

Reference

ResNet 论文链接

import torch
import torch.nn as nn

残差网络(ResNet)

VGGNet 与 Inception 出现后，学者们将卷积网络不断加深以寻求更优越的性能，然而所着网络的加深，网络却越发难以训练，方而会产生梯度消失现象: 另一方面越深的网络返回的梯度相关性会越来越差，接近于白噪声，导致梯度更新也接近于随机扰动。

更详细的说，对神经网络模型添加新的层，充分训练后的模型是否只可能更有效地降低训练误差？理论上，原模型解的空间只是新模型解的空间的子空间。也就是说，如果我们能将新添加的层训练成恒等映射 $f (x) = x$ ，新模型和原模型将同样有效。由于新模型可能得出更优的解来拟合训练数据集，因此添加层似乎更容易降低训练误差。然而在实践中，添加过多的层后训练误差往往不降反升。即使利用批量归一化带来的数值稳定性使训练深层模型更加容易，该问题仍然存在。

何恺明等人提出的ResNet(Residual Network，残差网络) 较好地解决了这个问题，并获得了 2015 年 ImageNet 分类任务的第一名。此后的分类、检测、分割等任务也大规模使用 ResNet 作为网络骨架。

主要贡献

提出了一种残差学习框架来减轻网络训练，这些网络比以前使用的网络更深。

显式地将层重构为学习关于层输入的残差函数，而不是学习未参考的函数。

提供了全面的经验证据说明这些残差网络很容易优化，并可以显著增加深度来提高准确性。

动机

最根本的动机就是所谓的“退化”问题，即当模型的层次加深时，错误率却提高了。

但是模型的深度加深，学习能力增强，因此更深的模型不应当产生比它更浅的模型更高的错误率。而这个“退化”问题产生的原因归结于优化难题，当模型变复杂时，SGD 的优化变得更加困难，导致了模型达不到好的学习效果。

Residual 块

通过 shortcut 连接， identity mapping 来加深网络。

ResNet 的思想在于引入了一个深度残差框架来解决梯度消失问题，即让卷积网络去学习残差映射，而不是期望每一个堆叠层的网络都完整地拟合潜在的映射(拟合函数)。如图所示，对于神经网络，如果我们期望的网络最终映射为 $H (x)$ , 左侧的网络需要直接拟合输出 $H (x)$ ，而右侧由 ResNet 提出的子模块，通过引入一个 shortcut (捷径)分支，将需要拟合的映射变为残差 $F (x) : H (x) - x$ 。 ResNet 给出的假设是:相较于直接优化潜在映射 $H (x)$ ，优化残差映射 $F (x)$ 是更为容易的。