tensorflow 训练过程中loss为nan.

本文探讨了深度学习训练中遇到loss值为nan的原因及解决办法,包括调整学习率、检查数据集中的异常值,如全白图片,并对数据预处理进行优化。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

在这里插入图片描述
训练过程中出现loss为nan的情况
nan的意思就是 not a number
在网上看了几篇博客后,可能有几种情况
1.出现为nan的情况可能是由于numpy数组中有nan元素出现,可能是由于数组中有零元素出现导致计算过程中出现数值过大问题
2.学习率设置得过大,可以调小学习率,看情况是否有改善

调整学习率和batch大小后仍然出现nan的情况,所以猜测是数组中有零元素的出现,并且零元素在分母的位置上,使得数值过大无法显示,在这里插入图片描述

猜测是归一化图像求标准差的地方出了问题,所以给标准差加1,再次运行后发现loss正常

后来发现是由于从网上下载的负样本的图片中出了问题,有些图片看起来是全白的,所以标准差可能为0或者非常小

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值