pytorch训练过程中loss出现NaN的原因及可采取的方法

转载已于 2022-07-23 14:45:15 修改 · 6.2w 阅读

·

18

·

CC 4.0 BY-SA版权

原文链接：https://blog.youkuaiyun.com/weixin_39092218/article/details/72915906

文章标签：

#loss #pytorch #nan

于 2018-06-22 21:32:30 首次发布

深度学习专栏收录该内容

12 篇文章

订阅专栏

本文探讨了PyTorch训练过程中遇到loss值为NaN的问题，分析了可能的原因，包括学习率设置过高、loss函数问题、数据预处理不当等，并提供了相应的排查和解决方法。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

同名微信公众号/知乎专栏: AI算法札记，欢迎关注交流

在pytorch训练过程中出现loss=nan的情况

1.学习率太高。

2.loss函数

3.对于回归问题，可能出现了除0 的计算，加一个很小的余项可能可以解决

4.数据本身，是否存在Nan，可以用numpy.any(numpy.isnan(x))检查一下input和target

5.target本身应该是能够被loss函数计算的，比如sigmoid激活函数的target应该大于0，同样的需要检查数据集

博客等级

码龄8年

79
原创

533
点赞

2546
收藏

8714
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

上一篇：: pytorch学习笔记之加载预训练模型

下一篇：: 机器学习维度灾难

最新评论

WSDM‘23 推荐系统论文梳理
AI算法札记: 论文只是提供个思路参考，大部分直接放生产环境，没多少价值
python写csv文件分隔符问题
Yizhe_Lin: writer.writerow([row])应该也能解决，一个字符串包括多个字符，一个列表包括1个字符串，csv以字符或字符串为单位进行分割。
如何进行算法学习（刷题/刷leetcode）
2301_76950984: 谢谢特别真诚的讲解，比如说出大部分企业考试比不过中等难度的题。一下降低心理负担了。
SIGIR‘22 推荐系统论文之序列推荐(长文)篇
孤天: 想问一下作者，2.3的代码跑通了吗？我这边运行的话会报错tensorflow.python.framework.errors_impl.InvalidArgumentError: Incompatible shapes: [256] vs. [252] [[{{node gradients/logistic_loss_3/mul_grad/BroadcastGradientArgs}}]]
ICLR‘23 UnderReview | LightGCL: 简单而有效的图对比学习推荐系统
qq_40739067: 这篇挺离谱的，对比学习没有用。用自己划分的数据集做实验，换成公开的数据集，效果能lightGCN都不如。浪费了我好久的时间，还以为发现新大陆了。

大家在看

JavaSE:方法的使用及递归

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。