浮点数在内存中的存储方式
首先给你一道题目,不借用其他工具,只通过自己的计算和感觉,写出你的答案,写完后,再看看和我给出的答案是否一致不,如果一致,恭喜你,你可以退出这篇文章了。如果不一样,请耐心看完接下来的内容,相信我,你会有所收获的。
int main()
{
int n = 9;
float* pFloat = (float*)&n;
printf("n的值为:%d\n", n);//n=9
printf("*pFloat的值为:%f\n", *pFloat);
*pFloat = 9.0;
printf("num的值为:%d\n", n);
printf("*pFloat的值为:%f\n", *pFloat);
return 0;
}
n的值为:9
*pFloat的值为:0.000000
num的值为:1091567616
*pFloat的值为:9.000000
看到这里的小伙伴们,不要灰心,不会做,做错了,不要紧,接下来弄懂这个知识点就好了。
想要弄懂以上代码为什么输出那样的结果,首先要知道浮点数在计算机内部的表⽰⽅法。
根据国际标准IEEE(电⽓和电⼦⼯程协会) 754,任意⼀个⼆进制浮点数V可以表⽰成下⾯的形式:
V = (−1) ∗ S M ∗ 2E
• (−1)S 表⽰符号位,当S=0,V为正数;当S=1,V为负数
• M 表⽰有效数字,M是⼤于等于1,⼩于2的
• 2
E 表⽰指数位
IEEE 754规定:
对于32位的浮点数,最⾼的1位存储符号位S,接着的8位存储指数E,剩下的23位存储有效数字M
对于64位的浮点数,最⾼的1位存储符号位S,接着的11位存储指数E,剩下的52位存储有效数字M
看不懂,没关系,接下来我就以上面的问题作为例子讲给你听。
int main()
{
int n = 9;
float* pFloat = (float*)&n;
//00000000000000000000000000001001 n的二进制表示
printf("n的值为:%d\n", n);//n=9(不变)
//0 00000000 00000000000000000001001
//符号位 E M
//(-1)^0 0.00000000000000000001001 2^(-126)
// 符号为正 M E=(-127+1)这里不懂的可以 先看下面
//因为folat类型只精确到小数点后六位,所以结果为 1*0.000000*2^(-126)=0.000000
printf("*pFloat的值为:%f\n", *pFloat);//0.000000
*pFloat = 9.0;
// (-1)^0 1.001 2^3
// 符号为正 M E=3
//0 10000010 00100000000000000000000
//符号位 E M
printf("num的值为:%d\n", n); //1091567616(十进制)=01000001000100000000000000000000(二进制)
printf("*pFloat的值为:%f\n", *pFloat);//9.000000(不变)
return 0;
}
3.2.1 浮点数存的过程
M
前⾯说过, 1≤M<2 ,也就是说,M可以写成 1.xxxxxx 的形式,其中xxxxxx表⽰⼩数部分。
IEEE 754规定,在计算机内部保存M时,默认这个数的第⼀位总是1,因此可以被舍去,只保存后⾯的
xxxxxx部分。⽐如保存1.01的时候,只保存01,等到读取的时候,再把第⼀位的1加上去。这样做的⽬的,是节省1位有效数字。以32位浮点数为例,留给M只有23位,将第⼀位的1舍去以后,等于可以保存24位有效数字。
E
⾸先,E为⼀个⽆符号整数(unsigned int)这意味着,如果E为8位,它的取值范围为0255;如果E为11位,它的取值范围为02047。但是,我们知道,科学计数法中的E是可以出现负数的,所以IEEE 754规定,**存⼊内存时E的真实值必须****再加上⼀个中间数,对于8位的E,这个中间数是127;**对于11位的E,这个中间数是1023。⽐如,2^10的E是10,所以保存成32位浮点数时,必须保存10+127=137,即10001001。3.2.2 浮点数取的过程指数E从内存中取出还可以再分成三种情况:
E不全为0或不全为1
这时,浮点数就采⽤下⾯的规则表⽰,即指数E的计算值减去127(1023),得到真实值,再将有效数字M前加上第⼀位的1。⽐如:0.5 的⼆进制形式为0.1,由于规定正数部分必须为1,即将⼩数点右移1位,则为1.0*2^(-1),其阶码为-1+127(中间值)=126,表⽰为01111110,⽽尾数1.0去掉整数部分为0,补⻬0到23位。
E全为0
这时,浮点数的指数E等于1-127(或者1-1023)即为真实值,有效数字M不再加上第⼀位的1,⽽是还原为0.xxxxxx的⼩数。这样做是为了表⽰±0,以及接近于0的很⼩的数字。
E全为1
这时,如果有效数字M全为0,表⽰±⽆穷⼤(正负取决于符号位s)。