java float的精度_java中的float和double的精度问题

本文深入探讨了计算机中float和double类型的存储方式,以及它们的精度和范围差异。float类型使用32位存储,包含1位符号位,8位指数位,23位尾数位,能表示7位有效数字,可能存在精度损失。而double类型使用64位,有1位符号位,11位指数位,52位尾数位,提供更高的精度,可达15位有效数字。因此,对于需要更高精度的计算,应选择double类型。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

此文解释了为何float的范围比int大(同样4字节),但有些int是float无法正确表达的(精度丢失)

java中的float和double的精度问题

1、背景知识

在java中没有细讲,只是讲了float占32位(bit),double占 64位。

对于计算机来说,用位数表示是合适的。但有人喜欢用字节(byte)表示。一个字节占8位。

1 byte = 8 bit.

所以float占4个字节,double占8个字节。

不过我还是喜欢用位数表示。这样更直接,也更容易理解计算机是怎么存储这些类型的。

对于精度和范围,还是参考一下c++吧。

2、存储知识

计算器存储浮点数的方法:(用科学计数法存储)

将要存的数先转换为小数(0.xxxxxx)x10的n次幂的形式进行存储。

例如:

3.1415 将被转换为:0.31415 x 10^1

100000 将被转换为:0.1 x 10^6

首先申明一点,先范围(有效数字位,包括整数位和小数位),再精度。

3、下面切入正题

=====================

在c++中单精度float类型与双精度double类型的问题

【"单精度用float表示,在计算机中使用4位字节(32位bit)来表示,具有7位有效数字"】

float类型存储的时候1个bit是符号位,8个bit是指数位,剩下的23个bit是有效数字位。

2的23次方是8388608,即7位有效数字,精度(10进制)。

一个单精度的浮点数在内存当中占用了32个bit位,按照浮点数的表示标准,最高位表示符号,这32位一部分用来表示阶码,一部分用来表示小数部分。

按照这个表示方法转化成10进制之后,它能表示的最高精度是7位有效数字。

比如

float a=3.14159;a在内存中实际上表示为0.314159乘以10的1次方(0是符号位),而分配给a的存储单元就分为两部分,一部分存0.314159,一部分存指数1,而且也都是转化为2进制来存。

==================

float ,1位符号位, 8位指数位,23位尾数位

double,1位符号位,11位指数位,52位尾数位

float尾数位23位,2^23=8.3E6,7位,所以不同的编译器规定不同,有些是7位,有些8位

double尾数52位,2^52=4.5E15,15位,所以double的有效位数是15位

后记:

数一下有效数字位数(整数位+小数位),7位以内的用float,15位以内的用double

但是还有一点小小的区别:

float f =  (float) 62345678.912345;  // => 6.234568E7  共 7 位

float f2 =  (float) 12345678.912345; // => 1.2345679E7 共 8 位

(精度问题,float精度为7--8位,8位的情况是第一位是1,当是2时进位后面的精度丢失?)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值