深度学习报错记录:验证过后，训练时损失激增，特征提取为nan值

剑桥街的木屋

于 2024-01-09 14:31:11 发布

阅读量587

点赞数 8

分类专栏：深度学习报错记录文章标签：深度学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/weixin_44854318/article/details/135478991

版权

文章描述了在使用带有batchnorm和dropout的模型进行训练时，忘记在验证后将模型切换回训练模式导致的loss值剧增和特征值nan的问题，解决方案是确保每次训练和验证前后正确设置model的训练模式。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

先说结论：model验证完之后忘了转回训练模式（模型里有batchnorm和dropout会出问题）

原本代码结构：

loss_fn = nn.CrossEntropyLoss()

def train(dataloader, model, loss_fn, ...):

        for x,y in dataloader:
            ...
            feature = model.forward(x) 
 
            pred = model.pred(feature) 

            loss = loss_fn(pred, y)
            ...

def val(dataloader,model,...):
        
        model.eval()

        for x,y in dataloader:
                ...
                ...

model.train()

for iteration in range(iteration_per_epoch * epoch):

        train(...)

        if iteration%500==0:

                val(...)

现象：我发现，在500次迭代之前（第一次验证之前）训练都不会出现问题，一旦验证过一次，之后的训练中的loss值会突然剧增(loss增大到1.54e+18这个量级)，紧接着特征提取时feature会出现nan值。

解决：每次训练之前都要设置model.tr

最低0.47元/天解锁文章

剑桥街的木屋

博客等级

码龄6年

10
原创

30
点赞

49
收藏

19
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

上一篇：: 创建自己的语义分割数据集过程中遇到的问题

最新评论

深度学习报错记录:验证过后，训练时损失激增，特征提取为nan值
优快云-Ada助手: 不知道 Python入门技能树是否可以帮到你：https://edu.youkuaiyun.com/skill/python?utm_source=AI_act_python
添加新的库时出现引用错误
优快云-Ada助手: 恭喜你写了第8篇博客，文章内容看起来非常有技术含量。对于添加新的库时出现引用错误这个问题，我也遇到过类似的情况。不过通过不断尝试和查找资料，最终还是解决了。希望你也能坚持下去，继续分享你的技术经验和心得体会。下一步的创作建议，可以考虑分享一些实用的代码片段或者项目经验，让大家更好地学习和掌握技术。期待你的下一篇博客！优快云会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.youkuaiyun.com/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply8 看奖励名单。
创建自己的语义分割数据集过程中遇到的问题
优快云-Ada助手: 恭喜作者写出了这篇有价值的博客！创建自己的语义分割数据集是非常有挑战性的，尤其是遇到问题时需要耐心解决。我希望作者可以继续分享自己的经验和教训，让更多人受益。下一步的创作建议是可以分享一些实用的技巧和工具，让读者更加轻松地创建自己的语义分割数据集。优快云会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.youkuaiyun.com/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply9 看奖励名单。
gee大津算法修改时遇到的geometry和超时问题
TX. MENG: 错误1我自己研究了一个星期都没解决，今天终于解决了，我都想给博主磕一个，感谢博主！！！
gee大津算法修改时遇到的geometry和超时问题
剑桥街的木屋: 按理说应该是把scale设置成空间分辨率，如果你确定分辨率是60的话可能是其他地方出现了问题

最新文章

目录

展开全部

收起

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。