学记笔记：模型Loss不下降不收敛的特殊原因

最新推荐文章于 2025-04-29 13:01:31 发布

YIHII

最新推荐文章于 2025-04-29 13:01:31 发布

阅读量1.6k

点赞数

CC 4.0 BY-SA版权

文章标签： python 机器学习人工智能神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/YIHII/article/details/129349351

文章讨论了在深度学习模型中，当使用多个Loss函数时可能出现的不收敛问题。这可能是由于Loss函数之间相互影响导致的冲突。解决方法包括验证每个Loss函数的逻辑，调整损失函数的权重，以及通过屏蔽部分Loss来识别冲突源。在确定损失函数的主从关系后，通过调整权重进行优化参数调试。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

模型Loss值除了在学习率过高、batch size过大等情况下可能不收敛，还有一种比较基础的情况，也就是模型的Loss函数本身出了问题。

这里也不是指使用的Loss函数不正确，而是当模型中存在复数个Loss函数时，Loss函数之间可能会相互影响。实际情况下，假设有三个Loss函数分别为Loss_fn_a()、Loss_fn_b()、Loss_fn_c()，其返回的Loss值分别为Loss_a、Loss_b、Loss_c，可能出现Loss_a下降，Loss_b和Loss_c都不变的情况，此时可以尝试先屏蔽Loss_fn_a()，测试其余两个Loss值是否正常下降，如果在屏蔽了Loss_fn_a()的情况下，后两个Loss值正常下降，那么应该是Loss_fn_a()与后两个损失函数冲突，若后两个Loss值仍不下降，那么大概率就是后两个损失函数之间存在冲突。

在多个损失函数之间存在冲突的情况下，首先需要验证损失函数的设计逻辑是否存在问题，其次如果每个损失函数独立出来都是正确的优化逻辑，那么就应该分析各个损失函数之间的主从关系，然后对不同的损失值加权重，将主要的损失值权重设置为较大，然后就是愉快的调参时间(*^_^*)

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。