转自知乎:https://www.zhihu.com/question/49812013/answer/148825073
转自博客:http://blog.youkuaiyun.com/lu597203933/article/details/46575803
自我总结:
链式法则传递误差时,对乘法项:0.9*0.9*...*0.9多了就成了0(梯度消失) , 1.1*1.1*...*1.1多了就远大于1(梯度激增)
1.3 梯度消失、梯度激增
本文探讨了链式法则中乘法项导致的梯度消失及梯度激增问题,解释了为何当乘法项累积过多时会出现这两种现象。
转自知乎:https://www.zhihu.com/question/49812013/answer/148825073
转自博客:http://blog.youkuaiyun.com/lu597203933/article/details/46575803
自我总结:
链式法则传递误差时,对乘法项:0.9*0.9*...*0.9多了就成了0(梯度消失) , 1.1*1.1*...*1.1多了就远大于1(梯度激增)
1.3 梯度消失、梯度激增
您可能感兴趣的与本文相关的镜像
Stable-Diffusion-3.5
Stable Diffusion 3.5 (SD 3.5) 是由 Stability AI 推出的新一代文本到图像生成模型,相比 3.0 版本,它提升了图像质量、运行速度和硬件效率
1766
924
1万+
202
1317

被折叠的 条评论
为什么被折叠?