【论文精读】ResNet (Deep Residual Learning for Image Recognition）

原创

已于 2024-02-01 17:27:49 修改 · 1k 阅读

24 ·

CC 4.0 BY-SA版权

文章标签：

#人工智能

于 2024-02-01 17:27:01 首次发布

论文链接：https://openaccess.thecvf.com/content_cvpr_2016/papers/He_Deep_Residual_Learning_CVPR_2016_paper.pdf

参考学习视频：【精读AI论文】ResNet深度残差网络_哔哩哔哩_bilibili

2.2 通过shortcuts进行恒等映射

2.2.1 数学表达式

2.2.2 当x和F(x)数据结构不相同难以相加时的处理方法

2.3 网络结构

2.3.1 Plain Network

2.3.2 Residual Network

3.实验

3.1 残差网络能够解决退化问题

3.2 ResNet网络层数变高会产生过拟合，模型效果会变差

1. 介绍

1.1 痛点——退化问题

1.1.1 问题描述

退化问题指的是当网络变深后性能还不如浅层的网络。如Figure 1. 所示，56层的训练和测试误差比20层还大。

1.1.2 解决方法

ResNet引入残差模块解决了网络退化的问题

1.2 残差

残差，即预测值和真实值之间的偏差。

如下图所示，红点为真实值，红线为预测值（相当于恒等映射），真实值与预测值之间的偏差就是残差。预测值x+偏差F(x)=真实值H(x)

2. 方法

2.1 残差结构

残差结构，如Figure 2. 所示

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

重生之我在CUC写代码

关注关注

18
点赞
踩
24

收藏

觉得还不错? 一键收藏
1
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

（论文精读）Deep Residual Learning for Image Recognition

安静到无声

02-20

107

=更深的神经网络更难训练。我们提出了一个残差学习框架，以简化网络的训练，这些网络比以前使用的神经网络要深得多。我们明确提出了一种以输入层为参考的学习残差神函数的层（残差块），而不是学习未参考的函数。我们提供了全面的经验证据，表明这些残差网络更易于优化，并且可以通过增加的深度来获得更高的准确性。在ImageNet数据集上，我们用来评估深度最大为152层的残差网络-比VGG网络...

李沐深度学习论文精读（一）AlexNet + ResNet

nju_spy的博客

09-07

1268

本文系统梳理了AlexNet(2012)和ResNet(2016)两篇里程碑式CNN论文的核心内容。AlexNet通过5个卷积层和3个全连接层，使用ReLU激活、多GPU训练和Dropout等技术，在ImageNet竞赛中取得突破性成果。ResNet提出残差学习框架，通过快捷连接解决深度网络训练难题，152层的网络在保持低复杂度的同时获得优异性能。两篇论文均展示了模型架构创新如何推动计算机视觉发展，其中AlexNet确立了CNN的基本范式，ResNet则解决了深度网络的优化问题。文章还详细介绍了论文阅读方法

1 条评论您还未登录，请先登录后发表或查看评论

Deep Residual Learning for Image Recognition.pdf

04-15

深度较之宽度对神经网络具有更重要的意义，能一定程度模拟人脑，但是随着深度的加深，会出现梯度消失问题，阻碍了模型的收敛。Deep Residual Learning for Image Recognition一文给出了一种避免梯度消失的网络模型-深度残差网络，对深度学习的发展至关重要。

【7】Deep residual learning for image recognition.pdf

08-26

Deeper neural networks are more difficult to train. We present a residual learning framework to ease the training of networks that are substantially deeper than those used previously. We explicitly reformulate the layers as learning residual functions with reference to the layer inputs, instead of learning unreferenced functions. We provide comprehensive empirical evidence showing that these residual networks are easier to optimize, and can gain accuracy from considerably increased depth. On the ImageNet dataset we evaluate residual nets with a depth of up to 152 layers—8 deeper than VGG nets [41] but still having lower complexity. An ensemble of these residual nets achieves 3.57% error on the ImageNet test set. This result won the 1st place on the ILSVRC 2015 classification task. We also present analysis on CIFAR-10 with 100 and 1000 layers. The depth of representations is of central importance for many visual recognition tasks. Solely due to our extremely deep representations, we obtain a 28% relative improvement on the COCO object detection dataset. Deep residual nets are foundations of our submissions to ILSVRC & COCO 2015 competitions1, where we also won the 1st places on the tasks of ImageNet detection, ImageNet localization, COCO detection, and COCO segmentation.

resNet讲解.pdf

10-29

关于resNet，笔者使用的讲解PPT,具体讲解内容包括，框架的发明背景，框架解决的问题，框架的创新点，框架的具体实现架构，框架效果与其他架构之间的对比，以及对于框架的数学原理的部分浅显解释

ResNet——Deep Residual Learning for Image Recognition(论文阅读)

Xiao_Ya__的博客

06-14

1781

ResNet——Deep Residual Learning for Image Recognition(论文阅读)

李沐论文精读： ResNet 《Deep Residual Learning for Image Recognition》 by Kaiming He

iwill323的博客

12-14

1613

李沐论文精读： ResNet 《Deep Residual Learning for Image Recognition》 by Kaiming He

【论文精读】Resnet残差网络（Deep Residual Learning for Image Recognition）

a2333333_的博客

09-27

3064

原文提出了残差网络，本文对论文进行了精度，解析

ResNet论文阅读

Aure219的博客

06-27

2170

更深层次的神经网络更难训练。我们提出了一个残差学习框架，以简化比以前使用的网络更深的网络训练。我们明确地将层重新表示为参考层输入的学习残差函数，而不是学习未引用的函数。我们提供了全面的经验证据，表明这些残差网络更容易优化，并且可以通过显着增加的深度来获得准确性。在 ImageNet 数据集上，我们评估深度高达 152 层的残差网络，比 VGG 网络 [41] 深 8 倍，但复杂度仍然较低。这些残差网络的集合在 ImageNet 测试集上实现了 3.57% 的误差。

ResNet实战.pdf

09-21

ResNet实战.pdf

Deep Residual Learning for Image Recognition

11-20

Deep Residual Learning for Image Recognition

resnet_18_structure.pdf

09-25

resnet 18 网络结构（摘要需要大于50个字节，所以请自动忽略这个括号。。。）

图像分类经典卷积神经网络—ResNet论文翻译（中英文对照版）—Deep Residual Learning for Image Recognition（深度残差学习的图像识别）

bigcindy的博客

08-04

5075

图像分类经典论文翻译汇总：[翻译汇总] 翻译pdf文件下载：[下载地址] 此版为纯中文版，中英文对照版请稳步：[ResNet纯中文版] Deep Residual Learning for Image Recognition 深度残差学习的图像识别 Kaiming He（何恺明） Xiangyu Zhang（张翔宇） Shaoqing Ren（任少卿） Jian Sun（孙剑） Microsoft Research（微软研究院）｛ka

论文精读——ResNet:Deep Residual Learning for Image Recognition

qq_52053775的博客

05-12

592

1.提出问题深度神经网络很难训练，不仅仅是过拟合的问题，而且训练不动，训练误差很高 2.干了什么为了解决这个问题，我们提出残差学习框架（residual learning framework），使得神经网络的训练变得容易，并且我们的网络比之前所有的网络都要深。 3.解决方法我们将网络层（layers）明确的定义为需要学习的残差函数（residual function，关于输入的函数），而不是学习未指定的函数（unreferenced functions）。 4.网络结构 Plain

ResNet 论文阅读笔记

Sail的博客

11-15

3118

ResNet 论文阅读笔记 #机器学习/深度学习文章介绍论文地址：https://arxiv.org/pdf/1512.03385.pdf 原文题目：Deep Residual Learning for Image Recognition 作者： Kaiming He 团队（微软亚洲研究院）该文是2016年CVPR 最佳论文，拿下来当年 ImageNet 等数据集以及各项比赛第一名。提出的 ResNet 是基于残差学习，让神经网络训练起来更加容易。直观上来说，神经网络可以越做越深、准确度也可以越来

Deep Residual Learning for Image Recognition这篇论文的源代码

最新发布

10-14

<think>嗯，用户这次的问题很明确，是要查找《Deep Residual Learning for Image Recognition》这篇经典论文的源代码。用户已经提供了论文的基本信息（CVPR 2016，Kaiming He等人），还贴心地给出了三个参考引用，不过这些引用主要是论文简介和资源推荐，没有直接提到代码位置。从对话历史看，用户似乎正在研究计算机视觉领域，可能是个研究生或工程师。ta能准确说出论文全名，说明对领域有一定了解，但可能第一次接触ResNet实现细节。用户情绪应该比较急切——毕竟找代码这种事拖不得。让我回忆下ResNet代码的常见来源：首先想到官方实现，但原论文没附代码链接（2015年arXiv版通常不包含）。好在作者团队后来在GitHub开源了，最权威的应该是微软亚洲研究院(MSRA)的仓库。另外PyTorch和TensorFlow官方模型库肯定有实现，毕竟ResNet是基础模型。需要注意两点：一是用户可能要原始CAFFE实现（论文用的框架），二是现在主流用PyTorch重写版。我得把不同版本都列出来，让用户自己选。对了，还要提醒安装依赖——有些老仓库需要特定版本的CAFFE。用户参考信息里提到优快云有复现文章，这类社区资源虽然非官方但适合初学者，顺便也列出来吧。最后强调下引用规范，毕竟学术场景要注意版权。（翻查资料确认链接）MSRA的GitHub仓库还活跃着，PyTorch hub的resnet50文档也检查过了…… 嗯，这些资源应该够用户用了。要不要补充训练脚本位置呢？——算了，用户没问训练细节，先给入口就好。 </think>根据论文《Deep Residual Learning for Image Recognition》（Kaiming He et al., CVPR 2016）的官方信息及开源社区实践，其源代码可通过以下途径获取： --- ### **1. 官方实现（CAFFE框架）** 论文作者团队在**Microsoft Research Asia (MSRA)** 的GitHub仓库提供了原始实现： 🔗 [https://github.com/KaimingHe/deep-residual-networks](https://github.com/KaimingHe/deep-residual-networks) - 包含预训练模型（ResNet-50/101/152）和训练脚本。 - 使用CAFFE框架，支持ImageNet分类任务复现。 --- ### **2. PyTorch官方模型库** PyTorch已将ResNet集成至`torchvision.models`： ```python from torchvision import models resnet18 = models.resnet18(pretrained=True) # ResNet-18/34/50/101/152等 ``` - 文档：[PyTorch ResNet Docs](https://pytorch.org/vision/stable/models.html#id3) - 完整训练代码参考：[PyTorch Examples](https://github.com/pytorch/examples/tree/main/imagenet) --- ### **3. TensorFlow/Keras实现** - **TensorFlow官方模型库**： [TF Model Garden - ResNet](https://github.com/tensorflow/models/tree/master/official/vision/modeling/backbones/resnet) - **Keras内置模型**： ```python from tensorflow.keras.applications import ResNet50 model = ResNet50(weights='imagenet') ``` --- ### **4. 第三方复现资源** | 框架 | 资源链接 | |------------|--------------------------------------------------------------------------| | **PyTorch** | [pytorch-resnet](https://github.com/pytorch/vision/blob/main/torchvision/models/resnet.py) | | **TensorFlow** | [TF ResNet](https://github.com/tensorflow/models/blob/master/official/legacy/image_classification/resnet/resnet_model.py) | | **简明实现** | [ResNet in 20 Lines](https://github.com/ry/tensorflow-resnet) (学习用) | --- ### **注意事项** 1. 原始论文使用**CAFFE**，若需完全复现实验，建议优先选择[官方仓库](https://github.com/KaimingHe/deep-residual-networks)。 2. 预训练模型下载： - PyTorch：`pretrained=True`自动下载 - CAFFE：官方GitHub提供模型下载链接（`.caffemodel`文件）[^1]。 3. 训练数据需遵循ImageNet格式，数据集准备可参考[ImageNet官方](http://www.image-net.org/)。 --- ### 相关问题 1. **ResNet的残差连接如何解决深层网络梯度消失问题？** > 残差块通过恒等映射（$ \mathcal{F}(x) + x $）使梯度可直接回传至浅层，缓解了链式求导的梯度衰减[^1]。 2. **ResNet相比VGG/Inception有何创新？** > 通过短路连接（shortcut）构造残差学习，允许网络深度超过100层而不退化（2015年突破性进展）[^3]。 3. **如何在自己的数据集上微调ResNet？** > 修改最后一层全连接，冻结浅层参数，用较小学习率微调分类层（示例代码见PyTorch/TF文档）。 [^1]: Kaiming He et al. *Deep Residual Learning for Image Recognition*. arXiv:1512.03385 [^3]: CVPR2016 ResNet 论文解读与复现分析