我们都知道在计算机中各种纷杂的数据,其实都是用0和1表达的,无论什么数据存入到计算机中都会被转化成二进制序列 ,这也就是计算机储存信息的方式。
下面我将以C语言中的几种数据类型来进行解释。
1.整型的储存
在C语言中,整型分为有符号整型和无符号整型,计算机储存这两种类型的方式是不一样的,我们首先来谈谈无符号整型。
比如我们unsigned int a = 10;在计算机存入一个10的步骤是什么呢,首先会把10转换成一个二进制序列,是1010,因为int的大小为4byte,所以实际上存入的是:
00000000000000000000000000001010共32位(1byte=8bit)
因为存的是无符号整型,所以没有符号位一说,直接在1010前面补0。
那有符号整型呢?int a = -10;计算机为了区分正负号,存入数字二进制序列的最高位为符号位,当数字为正数时,符号位为0,为负数时,符号位为1。
那-10在计算机里面就是10000000000000000000000000001010吗?并没有这么简单。
下面我们引入原码反码补码的概念:
1.原码是直接将数字按正负翻译成二进制序列码
2.反码是原码除符号位外其余位按位取反
3.补码是反码+1
所以我们可以得知10000000000000000000000000001010其实是-10的原码,
存进电脑还需要两步,第一步将原码转换成补码,/*这里解释一下什么是取反,原来的序列里面是0的变为1,是1的变为0,这就叫取反。*/好,我们符号位不变,其余位按位取反,得到:
11111111111111111111111111110101
下一步我们将反码其+1得到补码:
11111111111111111111111111110110;
这便是-10在计算机里储存的样子。
再补充两点
1.正数的原码反码补码相同,计算机储存的实际上是整数的补码。
2.补码有一个很好玩的特性,如果想要得到原码,正常思路是将补码-1,然后除符号位按位取反,但是其实也可以将反码+1,再除符号位按位取反,同样可以得到原码。
有些同学总喜欢别出心裁,比如非要在unsigned int 里面存一个-10,能存是能存,但是计算机这时候就不会认为11111111111111111111111111110110是负数,因为无符号整型是没有符号位的,于是乎就会变成存了一个非常大的数。
2.浮点型的储存
根据国际标准IEEE(电气和电子工程协会) 754,任意一个二进制浮点数V可以表示成下面的形式:
(-1)^S * M * 2^E
(-1)^s表示符号位,当s=0,V为正数;当s=1,V为负数。
M表示有效数字,大于等于1,小于2。
2^E表示指数位。
由于计算机中的二进制性质,许多浮点数是没法精确储存的,浮点数的精度是靠着小数点后面的位次增加,从而达到一个比较接近的结果,而且也会有四舍五入的性质,所以两个浮点数是没法直接比较的,通常都是作差,然后比较差值是否在允许的范围内。
计算机储存浮点数只储存,S,M,E的值,例如3.5,直接转化为二进制是11.1,小数点后x位就表示2的-x次幂,0.5是2的-1次幂,所以会转化为11.1,因为3.5是正数,所以S=0;M=1.11;小数点向左移动一位,E=1;
可以表示为标准形式(-1)^0*1.11*1;
由于浮点数的特殊储存性质,它并没有反码补码的概念,只有原码,将空间分为三份,第一份存符号位S,第二份存指数E,第三份存有效数字M。
3.整形提升
C语言整型算术运算总是至少以缺省整型类型的精度来进行的,为了获得这个精度,表达式中的字符型和短整型操作数在使用之前被转换为普通整型,这种转换成为整形提升。
数字的整形提升:无符号整型和整数整形提升高位补0,负数整形提升高位补1。
只要参与了运算就会发生整型提升,这里的运算甚至包括-a,也算参与运算。
类似的性质还有算数转换,比如某个操作符的两个操作数属于不同的类型,那么除非其中的一个操作数转换成另一种类型,否则无法进行运算。
下面是寻常算数转换的列表:
long double //C99引入 |
double |
float |
unsigned long int |
long int |
unsigned int |
int |
如果某个操作数的类型在上面这个列表中排名较低,那么首先要转换为另外一个操作数的类型后执行运算,转换的时候要用合理的方式,否则会出现一些精度问题