byte为什么要与上0xff?

本文探讨了在MD5加密过程中,为何需要将byte数组元素与0xFF进行按位与操作后再赋值给int类型。通过具体示例解释了这一操作背后的原理,即确保从byte到int转换时二进制补码的一致性。

转载:https://www.cnblogs.com/think-in-java/p/5527389.html

https://blog.youkuaiyun.com/lvgaoyanh/article/details/53486933

无意间翻看之间的代码,发现了一段难以理解的代码。

复制代码

     byte[] bs = digest.digest(origin.getBytes(Charset.forName(charsetName))) ;  
          
        for (int i = 0; i < bs.length; i++) {  
            int c = bs[i] & 0xFF ;
            if(c < 16){ 
                sb.append("0");  
            }  
            sb.append(Integer.toHexString(c)) ;  
        }  
        return sb.toString() ;  

复制代码

bs是由一段字符串经过MD5加密后,输出的byte数组。我起初难以理解为什么在接下来的循环中要将bs[i]&oxFF再复制给int类型呢?

bs[i]是8位二进制,0xFF转化成8位二进制就是11111111,那么bs[i]&0xFF不是还是bs[i]本身吗?有意思吗?

 

后来我又写了一个demo

复制代码

package jvmProject;

public class Test {

    public static void main(String[] args) {
        byte[] a = new byte[10];
        a[0]= -127;
        System.out.println(a[0]);
        int c = a[0]&0xff;
        System.out.println(c);
    }
}

复制代码

我先打印a[0],在打印a[0]&0xff后的值,本来我想结果应该都是-127.

但是结果真的是出人意料啊!

-127

129

到底是为什么呢?&0xff反而不对了。

 

楼主真的是不懂啊,后来往补码那个方向想了想。

记得在学计算机原理的时候,了解到计算机内的存储都是利用二进制的补码进行存储的。

复习一下,原码反码补码这三个概念

对于正数(00000001)原码来说,首位表示符号位,反码 补码都是本身

对于负数(100000001)原码来说,反码是对原码除了符号位之外作取反运算即(111111110),补码是对反码作+1运算即(111111111)

概念就这么简单。

 

当将-127赋值给a[0]时候,a[0]作为一个byte类型,其计算机存储的补码是10000001(8位)。

将a[0] 作为int类型向控制台输出的时候,jvm作了一个补位的处理,因为int类型是32位所以补位后的补码就是1111111111111111111111111 10000001(32位),这个32位二进制补码表示的也是-127.

发现没有,虽然byte->int计算机背后存储的二进制补码由10000001(8位)转化成了1111111111111111111111111 10000001(32位)很显然这两个补码表示的十进制数字依然是相同的。

 

但是我做byte->int的转化 所有时候都只是为了保持 十进制的一致性吗?

不一定吧?好比我们拿到的文件流转成byte数组,难道我们关心的是byte数组的十进制的值是多少吗?我们关心的是其背后二进制存储的补码吧

所以大家应该能猜到为什么byte类型的数字要&0xff再赋值给int类型,其本质原因就是想保持二进制补码的一致性。

当byte要转化为int的时候,高的24位必然会补1,这样,其二进制补码其实已经不一致了,&0xff可以将高的24位置为0,低8位保持原样。这样做的目的就是为了保证二进制数据的一致性。

当然拉,保证了二进制数据性的同时,如果二进制被当作byte和int来解读,其10进制的值必然是不同的,因为符号位位置已经发生了变化。

 

象例2中,int c = a[0]&0xff;  a[0]&0xff=1111111111111111111111111 10000001&11111111=000000000000000000000000 10000001 ,这个值算一下就是129,

所以c的输出的值就是129。有人问为什么上面的式子中a[0]不是8位而是32位,因为当系统检测到byte可能会转化成int或者说byte与int类型进行运算的时候,就会将byte的内存空间高位补1(也就是按符号位补位)扩充到32位,再参与运算。上面的0xff其实是int类型的字面量值,所以可以说byte与int进行运算。

### 按位取反后为什么0xff进行按位运算? 在对二进制数进行按位取反操作时,特别是在处理有符号整数(如`byte`类型)的情况下,通常会看到后续的按位操作使用了`0xFF`。这一操作的主要目的是**保留原始数据的低8位信息,并屏蔽掉高位扩展带来的符号影响**。 在大多数编程语言中(如Java),当对一个`byte`类型的值执行按位取反操作时,系统会自动将其提升为`int`类型进行计算。这意味着原本的8位数据会被填充至32位。如果原始`byte`值的最高位是1(即表示负数),那么在提升为`int`时,高位将被补1以保持数值的符号不变。这种行为称为**符号扩展**。例如,一个值为`-1`的`byte`(其二进制补码形式为`0xFF`),在转换为`int`时会被扩展为`0xFFFFFFFF`[^2]。 在这种情况下,直接对`byte`执行按位取反操作可能会导致结果超出预期范围。为了防止这种情况,通常会在按位取反之后紧接着使用`& 0xFF`操作。`0xFF`是一个十六进制常量,对应的二进制形式为`00000000 00000000 00000000 11111111`。通过`0xFF`进行按位操作,可以**只保留最低的8位数据,而忽略掉高位的符号扩展部分**。这确保了即使原始数据是有符号的,也能正确地获取到其8位表示形式。 例如,在Java中,以下代码展示了如何正确处理一个`byte`类型的按位取反: ```java byte b = (byte) 0xFF; // -1 in two's complement int result = ~b; // This will be 0x00000000 (which is 0) System.out.println(result); // Output: 0 // To get the correct 8-bit NOT result, mask with 0xFF int maskedResult = ~b & 0xFF; System.out.println(maskedResult); // Output: 255 ``` 上述示例中,如果不使用`& 0xFF`,则结果会因为符号扩展而变为0;而使用了`& 0xFF`后,实际得到的是`255`,这正是`0xFF`按位取反后的8位结果。 类似的机制也适用于其他需要处理固定长度字节数据的场景,比如网络通信、文件解析等,其中确保数据仅限于特定的位宽是非常重要的。 ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值