汇总 | Pytorch遇到的坑汇总

最新推荐文章于 2024-07-11 21:27:46 发布

不再更新，请勿购买！！

最新推荐文章于 2024-07-11 21:27:46 发布

阅读量649

点赞数

分类专栏： # Debug # Deep Learning 文章标签： pytorch python 深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/qazwsxrx/article/details/128518824

版权

Deep Learning 同时被 2 个专栏收录

64 篇文章

订阅专栏

6 篇文章

订阅专栏

在进行混合精度训练时遇到输出为NaN的情况，通常由于极大梯度引起，这可能与Sigmoid等函数有关。解决策略包括找到导致问题的loss或layer，替换为更稳定的选项。文章提供了进一步的信息链接以帮助诊断和解决问题。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1 训练时出现NaN

使用混合精度训练时出现了NaN
网络输入：无问题；
网络输出：Nan
问题分析：出现了极大的梯度，导致网络权重NaN
- 这通常由Sigmoid等函数导致
解决方法
- 找到导致无穷的loss或者layer
- 将其替换为不容易出现问题的loss / layer

更多信息：https://zhuanlan.zhihu.com/p/443166496

未完待续

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

不再更新，请勿购买！！ 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。