【论文阅读】Deep Residual Learning for Image Recognition

最新推荐文章于 2025-04-15 21:24:02 发布

MoFMan

最新推荐文章于 2025-04-15 21:24:02 发布

阅读量575

点赞数

CC 4.0 BY-SA版权

分类专栏：论文阅读文章标签： CNN 深度学习 ResNet

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/MoFMan/article/details/107302289

论文简介：

《Deep Residual Learning for Image Recognition》文章出自微软亚洲研究院何凯明团队，其分别获得ImageNet 2015 Detection, localization，Classification 任务的第一名，也分别获得 COCO 2015 Detection，Segmentation 任务的第一名。

一、Introduction 介绍

更大更深的网络模型具有更强大的representation power，由于梯度消失、梯度爆炸（vanishing/exploding gradients）等原因，深层网络比浅层网络更难进行训练。梯度消失、梯度爆炸在网络训练的起始阶段就会阻碍网络的收敛，较好的初始化策略，数据的归一化处理，Batch normalization，正则化，Dropout等技术已经可以有效的促进深度网络的高效训练。BN层的引入基本解决了plain net的梯度消失和梯度爆炸问题。

对于深层网络出现了退化现象（degradation）,对于相同的数据集，更深层的网络比浅层的网络在训练集和测试集上都具有更大的误差。这不是因为过拟合问题，过拟合是训练集误差更小，测试集误差较大。

对于一个浅层网络和深层网络来说，浅层网络的解空间包含于深层网络的解空间，深层网络的解应该不差于浅层网络的解࿰

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。