引言:
之所以写关于原码和补码的原因是在牛客网上做一道关于字符串转数字的问题,其中就涉及到转化过程中数字溢出的问题。所以特地进行了原码和补码的再度深入学习。
一.原码
数字分正负,如某人欠我钱,则可以用负数来表达。所以在原码中规定了二进制串的最高位用于标识符号位,即0代表正,1代表负。这其实是挺符合我们现实世界人思考方式。为了描述方便,这里我们这针对4位二进制进行分析。
现实世界中1在这4位二进制描述的计量世界中可表示为00000001。-2则可表示为10000010。所有4位二进制可表示的范围为-7~7
上述原码的表示方法没有问题,我们利用原码进行2+1运算时,我们可以发现能正确得到结果。但是,当我们计算4+5=0100+0101=1001,结果竟然是-1。明显与现实不符。不仅如此,我们知道计算机中减法是通过加法来实现的。这里我们计算4-3=4+(-3)=0100+1011=1111,即结果为-7.这显然也是不对的。
所以总结下来,原码是符合人类的阅读习惯的,但是对于计算机进行四则运算结果往往是不正确的。
二.补码
1.模
模的概念可以帮助理解补数和补码。
“模”是指一个计量系统的计数范围。如时钟等。计算机也可以看成一个计量机器,它也有一个计量范围,即都存在一个“模”。例如:时钟的计量范围是0~11,模=12。表示n位的计算机计量范围是0~2^(n)-1,模=2^(n)。
“模”实质上是计量器产生“溢出”的量,它的值在计量器上表示不出来,计量器上只能表示出模的余数。任何有模的计量器,均可化减法为加法运算。
例如:假设当前时针指向10点,而准确时间是6点,调整时间可有以下两种拨法:一种是倒拨4小时,即:10-4=6;另一种是顺拨8小时:10+8=12+6=6
在以12模的系统中,加8和减4效果是一样的,因此凡是减4运算,都可以用加8来代替。对“模”而言,8和4互为补数。实际上以12模的系统中,11和1,10和2,9和3,7和5,6和6都有这个特性。共同的特点是两者相加等于模。
2.补码引入
对于计算机,其概念和方法和模完全一样。n位计算机,设n=8 所能表示的最大数是11111111,若再加1成为100000000(9位),但因只有8位,最高位1自然丢失。又回了00000000,所以8位二进制系统的模为2^8。在这样的系统中减法问题也可以化成加法问题,只需把减数用相应的补数表示就可以了。把补数用到计算机对数的处理上,就是补码。
关于补码的设计原理及证明可见 详解原码补码
在介绍补码之前我们首先引入反码,所谓的反码就是对原码中除符号位之外的所有二进制取反。反码有什么用呢?下面我们慢慢看。
这里规定,针对一个数,如果是正数,那么补码=原码, 如果是负数,那么补码=原码的反码+1,我们发现反码是原码和补码转化的桥梁。
这里我们使用补码来进行运算。如我们计算4-3=4+(-3)=0100+1101(-3的原码是1011,反码是1100,则补码是1101)=00001,这里结果是5位,最高位产生溢出,我们这里去掉溢出位。则答案为对应数的补码0001,为了符合人类世界的阅读习惯,我们在将其转化成原码,由于1是正数,所有原码必然也是自身。
这里我们再计算上面4+5=0100+0101=1001,1001是补码,我们要求它的原码,规则为除符号位取反+1,则结果为1111,即为-7.(如果补码最高位为0,则原码为自身。否则为除符号位取反+1>)
正如前面讲过的模的概念。这里4+5=-7是为什么呢?因为-8~7其实是构成一个环,9-7=2,超过边界2个位置。故从左边继续从-8开始向前2个位置则为-7,这就是模的意义。即保证结果一定在模代表的范围内。
3.思考
四位二进制时,补码表示范围为-8~7,因为这里补码表示将-0和+0区分开了。这里的-0=1000,即表示-8(这是硬性规定),+0=0000表示真正的0. 即在计算中任何计算如果超过计算机表示范围则必定会出现溢出,导致计算结果错误。,同时为了处理这些问题,java中提供了大整数类处理整数运算的工具类。