梯度弥散（Vanishing Gradient）和梯度爆炸（Exploding Gradient）

浩瀚之水_csdn

已于 2025-04-03 09:16:55 修改

阅读量1k

点赞数 20

分类专栏：深度学习目标检测(YOLO)专栏深度学习目标检测 # 目标检测（理论）文章标签： YOLO

于 2025-03-31 09:26:38 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/a8039974/article/details/146799261

版权

深度学习目标检测(YOLO)专栏同时被 3 个专栏收录

424 篇文章 ¥9.90 ¥99.00

订阅专栏

深度学习目标检测

345 篇文章

订阅专栏

目标检测（理论）

108 篇文章

订阅专栏

梯度弥散（Vanishing Gradient）和梯度爆炸（Exploding Gradient）是深度学习中常见的问题，特别是在训练深度神经网络时。它们会影响模型的训练效果和稳定性。

一、定义与原因

1. 梯度弥散（Vanishing Gradient）

定义：梯度弥散是指在反向传播过程中，梯度值逐渐变小，接近于零，导致网络的浅层参数几乎不更新，模型难以学习到输入数据的复杂特征。

原因：

深层网络：随着网络层数的增加，梯度在反向传播过程中需要通过多层网络，每层的梯度都会乘以一个权重和激活函数的导数。如果每层的梯度都小于1，经过多层传递后，梯度将趋近于零。
激活函数：使用Sigmoid或Tanh等激活函数时，当输入值很大或很小时，激活函数的导数接近于零。这会导致梯度在反向传播过程中逐层减小。

2. 梯度爆炸（Exploding Gradient）

定义：梯度爆炸是指在反向传播过程中，梯度值变得异常大，导致模型权重更新过度，参

了解本专栏

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

浩瀚之水_csdn 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。