之前面试的时候被问浮点数在计算机中是如何存储的?瞬间懵逼,回来赶紧学习了下弥补自己幼小的心灵。
刚刚开始学习Java的时候,我们就学过浮点数包括float和double,其中float占4个字节,double占8个字节。之前并没有细想他们和整形(比如int)有什么区别。
学习之后才知道浮点数并不是和整数一样在计算机中直接存储(高位表示符号位、低位是数据位)。
废话不多说,言归正传。。
浮点型在计算机存储包括三个部分:符号位(1位)+幂指位(8位或者11位)+数值位(23位或者52位)
其中位数不同是去呗float和double来说的,如下:
float 32 = 1 + 8 + 23
double 64 = 1 + 11 + 52
根据国际标准IEEE(电气和电子工程协会)规定:
任何一个浮点数NUM的二进制数可以写为: num = (-1)^S*M*2^E
;
其中S表示符号,E表示阶乘,M表示有效数字
①当S为0时,表示一个正数;当S为1时,表示一个负数
②M表示有效数字,1<= M <2
③2^E表示指数
比如十进制的3.0,二进制就是0011.0 就可以写成(-1)^ 0 * 1.1 * 2 ^ 1
在比如十进制的-3.0,二进制就是-0011.0 就可以写成(-1)^ 1 * 1.1 * 2 ^ 1
以float类型为例:
IEEE对于(有效数字)M和(指数)E有特殊的规定: (以float为例)
- 因为M的值一定是1<= M <2,所以它绝对可以写成1.xxxxxxx的形式,所以规定
M在存储时舍去第一个1,只存储小数点之后的数字
。这样做节省了空间,以float类型为例,就可以保存23位小数信息,加上舍去的1就可以用23位来表示24个有效的信息。 - 对于(指数)E是一个无符号整数所以E的取值范围为(0~ 255),但是在计数中指数是可以为负的,所以规定
在存入E时,在它原本的值上加上中间数(127),在使用时减去中间数(127),这样E的真正取值范围就成了(-127~128)
。
对于E还分为三种情况:
①E不全为0,不全为1:
这时就用正常的计算规则,E的真实值就是E的字面值减去127(中间值),M的值要加上最前面的省去的1。
②E全为0
这时指数E等于1-127为真实值,M不在加上舍去的1,而是还原为0.xxxxxxxx小数。这样为了表示0,和一些很小的整数。
所以在进行浮点数与0的比较时,要注意。
③E全为1
当M全为0时,表示±无穷大(取决于符号位);当M不全为1时,表示这数不是一个数(NaN)
另外,虽然long和double在存储系统中占用的空间是相同的(都是64位),但是double的范围要远远大于long的,因为double其中的8为存储的是指数也就是最大是。