Softmax 函数数值稳定性

最新推荐文章于 2025-04-25 17:27:05 发布

原创最新推荐文章于 2025-04-25 17:27:05 发布 · 1.3k 阅读

·

4

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#softmax #数值计算 #数值稳定性

机器学习同时被 2 个专栏收录

36 篇文章

订阅专栏

6 篇文章

订阅专栏

在计算机数学运算中，使用有限比特位表达实数会导致近似误差，这可能使算法失败。Softmax函数通过调整避免上溢出和下溢出，确保数值稳定性，对算法实现至关重要。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Softmax 函数数值稳定性

我们在使用计算机数学运算时需要使用有限的比特位来表达实数，这会导致近似误差的产生。近似误差可以在多步数值运算中传递、积累，从而导致理论上成功的算法失败。 几种常见的误差产生就是上溢出和下溢出。

下面具体看softmax的稳定性：
在这里插入图片描述

tips：以下大写表示向量

上式①中是 softmax(X) 函数，根据式子易得：当x趋于负无穷时exp(x)下溢出；x趋于正无穷时，exp(x)上溢出。

改变过的式子见②，max(X)中中的X是一个向量，整个是指向量中最大的数值，简单的一个小技巧见式子②，改变过的式子当X的分量较小时， Z的分量至少有一个为零，从而导致softmax(Z)的分母至少有一项为 1，从而解决了下溢出的问题；当X的分量较大时， softmax(Z)相当于分子分母同时除以一个非常大的数 exp(max(X))，从而解决了上溢出。

在多数情况下不需要去考虑这些东西，你只需要去使用相关的底层依赖，一般来说都解决了这些问题，但是当自己的算法需要实现的时候我们就需要去考虑数值稳定性的问题，否则可能会出现很严重的后果。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。