从tf.math.log_softmax和tf.keras.losses.SparseCategoricalCrossentropy看softmax的上溢和下溢问题

最新推荐文章于 2025-03-30 11:46:02 发布

原创

最新推荐文章于 2025-03-30 11:46:02 发布 · 553 阅读

·

1

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

文章讨论了softmax函数在处理大或小数值时可能出现的上溢和下溢问题，以及如何利用softmax的冗余性和tf.math.log_softmax来解决这些问题。在深度学习中，这些问题可能影响模型的可靠性和交叉熵损失计算的准确性。tf.keras.losses.SparseCategoricalCrossentropy的from_logits参数是一个应对策略，它将激活函数移到损失函数内部，减少数值溢出的影响。

什么是softmax的上溢和下溢问题

$\text{[math]}$

从公式可以看出，对于电脑计算指数函数exp(x)时，

如果x过于大，比如1000，则会变为inf，无穷大,这就是softmax的上溢问题；

同样，如果x过于小，比如-1000，则exp(-1000)会直接收敛为0，当softmax的分母的每一项都是0时，就是对应的softmax的下溢问题。

解决这个问题的方法就是利用softmax的冗余性。即，softmax(x-a)=softmax(x)。注明，tf.math.softmax已经默认使用了此方法来解决上溢和下溢问题。详情见：(12条消息) softmax上溢和下溢问题_会飞的猩猩。的博客-优快云博客_softmax 下溢

但是虽然通过冗余性可以解决上溢和下溢问题，但是数值的近似化已经生成，lo

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

会发paper的学渣 您的鼓励和将是我前进的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。