浮点数的存储

请先看以下代码的运行结果

int main()
{
	int n = 9;
	float* pFloat = (float*)&n;//9
	printf("n的值为:%d\n", n);//0.000000
	printf("*pFloat的值为:%f\n", *pFloat);
	*pFloat = 9.0;
	printf("n的值为:%d\n", n);//1091567616
	printf("*pFloat的值为:%f\n", *pFloat);//9.000000
	system("pause");
	return 0;
}

运行结果如下:
在这里插入图片描述
所以你算对了吗?
想要搞清楚上面代码我们必须搞清楚浮点数的存储原理。

根据国际标准IEEE (电气和电子工程协会) 754 ,任意-一个二进制浮点数V可以表示成下面的形式:

●(-1)S* M* 2^E
●(-1)^s表示符号位,当s=0, V为正数:当s=1 , V为负数。
●M表示有效数字,大于等于1 , 小于2。
●2^E表示指数位。

举例来说:12.5的二进制存储为1100.1
转化为存储便是 -1 ^ 01.10012 ^ 3
IEE754规定,对于32位的浮点数,最高一位为符号位s,接着八位是指数E,剩下的32位为有效数字M。 对于64位的浮点数,最高的1位是符号位S ,接着的11位是指数E ,剩下的52位为有效数字M。
IEEE 754对有效数字M和指数E ,还有一些特别规定。前面说过 , 1sM<2 , 也就是说, M可以写成1. xxxxx的形式,其-xxxxx表示小数部分。
IEEE 754规定,在计算机内部保存M时,默认这个数的第一位总是1 ,因此可以被舍去,只保存后面的xxxx部分。比如保存1 01的时候,只保存01 ,等到读取的时候,再把第一位的1加上去。这样做的目的,是节省1位有效数字。以32位浮点数为例,留给M只有23位,将第一位的1舍去以后 ,等于可以保存24位有效数字。
至于指数E ,情况就比较复杂。首先,E为一个无符号整数( unsigned int )这意味着,如果E为8位,它的取值范围为0-255 ;如果E为11位,它的取值范围为0~2047。但是,我们知道,科学计数法中的E是可以出现负数的,所以IEEE 754规定,存入内存时E的真实值必须再加上一个中间数,对于8位的E ,这个中间数是127 ;对于11位的E , 这个中间数是1023。比如, 2^10的E是10,所以保存成32位浮点数时,必须保存成10+127-137 ,即10001001。
然后,指数E从内存中取出还可以再分成三种情况:
1.E不全为0或不全为1
这时,浮点数就采用下面的规则表示,即指数E的计算值减去127 (或1023) , 得到真实值,再将有效数字M前加上第一位的1。比如: 0.5( 112 )的二进制形式为0.1 ,由于规定正数部分必须为1 ,即将小数点右移1位,则为1.0*2(-1) ,其阶码为-1+127=126 ,表示为1111110 ,而尾数1.0去掉整数部分为0,补齐0到23位000000000000000000 ,则其二进制表示形式为:0 01111110 0000000000000000000
2.E全为0
这时,浮点数的指数E等于1-127 (或者1-1023 )即为真实值,有效数字M不再加上第一位的1 而是还原为0.xxxxx的小数。这样做是为了表示0 ,以及接近于0的很小的数字。
3.E全为1
这时 ,如果有效数字M全为0 ,表示无穷大(正负取决于符号位s) ;
好了,关于浮点数的表示规则,就说到这里。
解释前面的题目:
下面,让我们回到开始的问题:为什么00000009还原成浮点数,就成了0.00000 ?首先,将00000009拆分,得到第- -位符号位s=0 ,后面8位的指数E0000000 , 最后23位的有效数字M=000 0000 0000 0000 00001001.

9 -> 0000 0000 000 0000 0000 0000 0000 1001

由于指数E全为0 ,所以符合上一节的第二种情况。因此,浮点数V就写成: V=(-1)^0 x
0.000000000000010120(-126)-1.001x2^(-146)显然, V是一个很小的接近于0的正数,所以用十进制小数表示就是000000。

再看例题的第二部分。请问浮点数9.0 ,如何用二进制表示?还原成十进制又是多少?首先,浮点数9.0等于二进制的1001.0 ,即1.001x2^3。

9.0 -> 1001.0 ->(-1)A01.0012^3 -> s=0, M=1.001, E=3+127=130
那么,第一位的符号位s=0 ,有效数字M等于001后面再加20个0,凑满23位,指数E等于3+127=130,即10000010。所以,写成二进制形式,应该是s+E+M,即

010000010 001 0000 0000 0000 0000 0000

这个32位的二进制数,还原成十进制,正是1091567616.

### IEEE 754 浮点数存储详解 IEEE 754 是一种广泛使用的浮点数表示标准,用于定义计算机中浮点数值的存储方式。该标准通过三个主要部分来描述一个浮点数:符号位、指数码以及尾数码。 #### 符号位 (Sign Bit) 符号位是一个单比特值,用来表示浮点数的正负性。如果符号位为 `0`,则代表这是一个正值;如果是 `1`,则代表这是一个负值[^1]。 #### 指数码 (Exponent Field) 指数码是用来表示浮点数规模的部分,在 IEEE 754 中采用移码形式进行编码。对于单精度浮点数(32 位),指数域占用 8 位,而双精度浮点数(64 位)则使用 11 位作为指数域。为了简化比较操作并避免处理负指数的情况,实际存储的是经过偏置后的真值。具体来说,偏置值被设定为 \(2^{k-1} - 1\) ,其中 k 表示指数域所占的位数。例如,在单精度情况下,\(k = 8\),所以偏置值等于 \(2^{8-1}-1=127\)[^1]。这意味着当原始指数 e 的范围是从 \(-126\) 到 \(127\) 时,其对应的指数码 E 应满足关系式 \(E=e+127\) 。特殊情形如全零或全一的指数码另有特定含义,比如分别对应于次正规数或者无穷大/NaN 等情况[^2]。 #### 尾数码 (Mantissa/Fraction Field) 尾数码也称为有效数字部分,它决定了浮点数的具体数值大小。在规范化表达中,默认存在隐含的一位整数前缀 '1.' 被省略掉不再显式存储,仅记录小数点之后的小数部分。这样可以提高数据密度并且保持较高的精确度。例如,假设某个规格化浮点数的有效数字为 \(1.x_1x_2...x_n\) (这里 n 取决于尾数长度),那么实际上只保存了 \(x_1x_2...x_n\) 这些后续位元组[^1]。 以下是基于 Python 实现的一个简单例子展示如何解析给定十进制数到 IEEE 754 单精度格式的过程: ```python import struct def float_to_ieee754(value): packed = struct.pack('!f', value) # Pack the floating-point number into bytes. unpacked = ''.join(f'{byte:0>8b}' for byte in packed[::-1]) # Convert each byte to binary string and reverse order. sign_bit = int(unpacked[0]) exponent_bits = int(unpacked[1:9], base=2) - 127 fraction_bits = sum(int(bit)*pow(2, -(idx)) for idx, bit in enumerate(unpacked[9:], start=1)) result = (-1)**sign_bit * (1 + fraction_bits) * pow(2, exponent_bits) return f"{'-' if sign_bit else ''}{result:.{len(str(abs(result)))}e}" print(float_to_ieee754(-20.5)) ``` 此脚本会输出 `-2.050000e+01`, 它展示了按照 IEEE 754 标准转换得到的结果。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值