Java浮点数为什么精度会丢失[转]

最新推荐文章于 2025-02-05 23:55:09 发布

原创最新推荐文章于 2025-02-05 23:55:09 发布 · 162 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#Java #F# #D语言

本文探讨了Java中float和double类型的表示方法及其精度限制，通过具体实例解释了为何某些整数在float类型下无法被准确表示。

Java 浮点数为什么精度会丢失

由于对float 或double 的使用不当，可能会出现精度丢失的问题。问题大概情况可以通过如下代码理解:

　　Java 代码

　　public class FloatDoubleTest {

　　public static void main(String[] args) {

　　float f = 20014999;

　　double d = f;

　　double d2 = 20014999;

　　System.out.println("f=" + f);

　　System.out.println("d=" + d);

　　System.out.println("d2=" + d2);

　　}

　　}

　　得到的结果如下：

　　f=2.0015E7

　　d=2.0015E7

　　d2=2.0014999E7

　　从输出结果可以看出double 可以正确的表示20014999 ，而float 没有办法表示20014999 ，得到的只是一个近似值。这样的结果很让人讶异。20014999 这么小的数字在float 下没办法表示。带着这个问题，一起学习一下浮点数，做个简单分享，希望有助于大家对java 浮点数的理解。

　　1. 关于 java 的 float 和 double 的表示法

　　Java 语言支持两种基本的浮点类型： float 和 double 。java 的浮点类型都依据 IEEE 754 标准。IEEE 754 定义了32 位和 64 位双精度两种浮点二进制小数标准。

　　IEEE 754 用科学记数法以底数为 2 的小数来表示浮点数。

　　对于32 位浮点数float 用第1 位表示数字的符号，用第2 至9 位来表示指数，用最后23 位来表示尾数，即小数部分。

　　float(32 位):

　　对于64 位双精度浮点数，用第1 位表示数字的符号，用 11 位表示指数，52 位表示尾数。

　　double(64 位):

　　都是分为三个部分：

　　(1) 一个单独的符号位s 直接编码符号s 。

　　(2)k 位的幂指数E ，移码表示。

　　(3)n 位的小数，原码表示。

　　2. 什么时候会出现无法表示？

　　任何一个数字，在java 底层表示都必须转换成这种科学计数法来表示，那么我们来想想看什么时候这个数字会无法表示呢？那么只有两种情形：

　　1. 幂数不够表示了：这种情况往往出现在数字太大了，超过幂数所能承受的范围，那么这个数字就无法表示了。如幂数最大只能是10 ，但是这个数字用科学计数法表示时，幂数一定会超过10 ，就没办法了。

　　2. 尾数不够表示了：这种情况往往出现在数字精度太长了，如1.3434343233332 这样的数字，虽然很小，还不超过2 ，这种情况下幂数完全满足要求，但是尾数已经不能表示出来了这么长的精度。

　　3. 20014999 为什么用 float 没有办法正确表示？

　　通过以上分析，应该已经知道，这个数字不大，转换成IEEE754 科学计数法之后幂数一定是满足要求的，只是尾数不能表示这么精确的数字了。

　　结合 float 和double 的表示方法，通过分析 20014999 的二进制表示就可以知道答案了。

　　以下程序可以得出 20014999 在 double 和 float 下的二进制表示方式。

　　Java 代码

　　public class FloatDoubleTest3 {

　　public static void main(String[] args) {

　　double d = 20014999;

　　long l = Double.doubleToLongBits(d);

　　System.out.println(Long.toBinaryString(l));

　　float f = 20014999;

　　int i = Float.floatToIntBits(f);

　　System.out.println(Integer.toBinaryString(i));

　　}

　　}

　　输出结果如下：

　　Double:100000101110011000101100111100101110000000000000000000000000000

　　Float:1001011100110001011001111001100

　　对于输出结果分析如下。对于都不 double 的二进制左边补上符号位 0 刚好可以得到 64 位的二进制数。根据double 的表示法，分为符号数、幂指数和尾数三个部分如下：

　　0 10000010111 0011000101100111100101110000000000000000000000000000

　　对于 float 左边补上符号位 0 刚好可以得到 32 位的二进制数。根据float 的表示法，也分为符号数、幂指数和尾数三个部分如下：

　　0 10010111 00110001011001111001100

　　绿色部分是符号位，红色部分是幂指数，蓝色部分是尾数。

　　对比可以得出:

　　符号位都是 0 。

　　幂指数为移码表示, 两者刚好也相等。

　　唯一不同的是尾数。

　　在 double 的尾数为： 001100010110011110010111 0000000000000000000000000000 ，省略后面的零，至少需要24 位才能正确表示。

　　而在 float 下面尾数为： 00110001011001111001100 ，共 23 位。

　　为什么会这样？原因很明显，因为 float 尾数最多只能表示 23 位，所以 24 位的 001100010110011110010111 在 float 下面经过四舍五入变成了 23 位的 00110001011001111001100 。所以 20014999 在 float 下面变成了 20015000 。

　　也就是说 20014999 虽然是在float 的表示范围之内，但在 IEEE 754 的 float 表示法精度长度没有办法表示出 20014999 ，而只能通过四舍五入得到一个近似值。

　　小结

　　浮点运算很少是精确的，只要是超过精度能表示的范围就会产生误差。往往产生误差不是因为数的大小，而是因为数的精度。因此，产生的结果接近但不等于想要的结果。尤其在使用 float 和 double 作精确运算的时候要特别小心。

　　可以考虑采用一些替代方案来实现。如通过 String 结合 BigDecimal 或者通过使用 long 类型来转换。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。