遇到此类问题,一般讲学习率调小就会解决。
推测是由于学习率较大错过了收敛方向的最佳值,导致损失过大,显示出错。
本文探讨了在训练过程中遇到因学习率设置过大而导致模型损失值异常增大的问题。建议通过减小学习率来帮助模型更好地收敛。
遇到此类问题,一般讲学习率调小就会解决。
推测是由于学习率较大错过了收敛方向的最佳值,导致损失过大,显示出错。
1291
2216
841

被折叠的 条评论
为什么被折叠?