浮点数在内存中的存储

本文详细解释了IEEE754标准如何在内存中存储浮点数,包括浮点数的小数点后表示、科学计数法中M和E的存储规则,以及针对32位float和double类型的特定规定,特别强调了溢出处理和特殊值的表示方法。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

浮点数在内存中的储存方式是按IEEE 754标准

(-1)的S次方*M*2的E次方

即(-1)^S*M*2^E

S是0或1,用来表示正负,0为正,1为负

[M是浮点数转化为二进制后的二进制科学计数法的小数部分所以M的取值范围为1<=M<2]

2^E是浮点数转化为二进制后的二进制科学计数法的指数部分

5.0的二进制是101.0

它的二进制用科学计数法表示为

(-1)^0*1.01*2^2

因为它小数点往左移动了两位。

此处可类比于10进制的科学计数法。

比如十进制的101的科学计数法为1.01*10^2

float类型和double类型中M,E,S所占字节数

float:

S的值只有0和1,所以占一个比特位就可以

E占8个比特位,E被定义为无符号数,所以E的范围为0~255

M占23个比特位

double:

S的值也只有0和1,所以占一个比特位就可以

E占11个比特位,double的E也是无符号数,所以E的范围为0~2047

M占52个比特位

浮点数小数点后的数的表示

浮点数的小数点后数的二进制表示是以2的-k加出来的

即 浮点数的小数的二进制表示是1(或0)*2的-k  +  1(或0)2的-(k+1)

所以9.5的二进制表示为1001.1

因为以上的表示方式,所以有一些浮点数在二进制中是不能精确保存的,因为凑不出二的几次方加二的几次方,正好等于小数点后的那几个数。

科学计数法的小数部分M的特别规定

IEEE 754对有效数字M和指数E,还有一些特别规定。

前面说过 1<=M<2, 也就是说,M可以写成1. xxxxxx的形式,其中xxxxx表示小数部分。

IEEE 754规定,在计算机内部保存M时,默认这个数的第一 位总是1

因此可以被舍去,只保存后面的xxxxxx部分。比如保存1.01的时候,只保存01,等到读取的时候,再把第一位的1加上去。 这样做的目的,是节省1位有效数字。

以32位浮点数为例,留给M只有23位,将第一位的1舍去以后,等于可以保存24位有效数字
 

指数E的特别规定

首先,E为一个无符号整数(unsigned int)

这意味着,如果E占8个比特位(fioat),它的取值范围为0~255;

如果E占11个比特位(double),它的取值范围为0~2047.

但是我们知道,科学计数法中的E是可以出现负数的

所以IEEE 754规定,

存入内存时E(无论正负)的真实值必须再加上一个中间数,计算时再减去中间值

对于8位的E,这个中间数是127

对于11位的E,这个中间数是1023

比如,2^10的E是10, 所以保存成32位浮点数时,E必须保存成10+127=137 即二进制的

10001001。

因为中间值的特点,有以下两种特殊请况

E的二进制的比特位中全为0

这时,浮点数的指数E的真实值等于-127 (或者-1023)

有效数字M不再加上第一位的1, 而是还原为0.*xxxx的小数。

这样做是为了表示+1~0,以及接近于0的很小的数字。

E的二进制的比特位中全为1

这时, 如果有效数字M全为0,表示+/-无穷大(正负取决于符号位s) ;

评论 18
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值