为什么负数要用补码表示
以 int
类型的数字作为例子,int 类型是 32
位的,其中最高位是作为「符号标志位」,正数的符号位是 0
,负数的符号位是 1
,剩余的 31 位则表示二进制数据。
负数补码:符号位不变,其他位取反+1.
如果负数不用补码来表示,如果做常规的加操作,如-2 + 1
,就需要特殊处理,要先判断数字是否为负数,如果是负数就要把加法操作变成减法操作,或者或者把减法反转成加法才可以得到正确对结果。
而用了补码的表示方式,对于负数的加减法操作,实际上是和正数加减法操作一样的。
十进制小数与二进制的转换
小数部分的转换采用的是乘 2 取整法。
0.1
的二进制表示是无限循环的。
由于计算机的资源是有限的,所以是没办法用二进制精确的表示 0.1,只能用**「近似值」来表示,即在有限的精度情况下,最大化接近 0.1 的二进制数,于是就会造成精度缺失**的情况。
计算机是怎么存小数的?
计算机存储小数的采用的是浮点数,名字里的「浮点」表示小数点是可以浮动的。
比如 1000.101
这个二进制数,可以表示成 1.000101 x 2^3
,最为关键的是 000101 和 3 这两个东西,它就可以包含了这个二进制小数的所有信息:
000101
称为尾数,即小数点后面的数字;3
称为指数,指定了小数点在数据中的位置;
计算机使用的浮点数一般包含三个部分,三个部分的意义如下:
- 符号位:表示数字是正数还是负数,为 0 表示正数,为 1 表示负数;
- 指数位:指定了小数点在数据中的位置,指数可以是负数,也可以是正数,指数位的长度越长则数值的表达范围就越大;
- 尾数位:小数点右侧的数字,也就是小数部分,比如二进制 1.0011 x 2^(-2),尾数部分就是 0011,而且尾数的长度决定了这个数的精度,因此如果要表示精度更高的小数,则就要提高尾数位的长度;
用 32
位来表示的浮点数,则称为单精度浮点数,也就是我们编程语言中的 float
变量,而用 64
位来表示的浮点数,称为双精度浮点数,也就是 double
变量。
0.1+0.2=0.3?
不是的,0.1 和 0.2 这两个数字用二进制表达会是一个一直循环的二进制数,比如 0.1 的二进制表示为 0.0 0011 0011 0011… (0011 无限循环),0.1 无法精确表达,这是浮点数计算造成精度损失的根源。
因此,IEEE 754 标准定义的浮点数只能根据精度舍入,然后用「近似值」来表示该二进制,那么意味着计算机存放的小数可能不是一个真实值。只能采用近似数的方式来保存,那两个近似数相加,得到的必然也是一个近似数。
参考资料
《小林 coding》
《深入理解计算机系统 第3版》