char, unsigned char, int,unsigned int之间的相互转换

本文深入探讨了在计算机编程中,有符号和无符号数据类型之间的转换问题,特别是在处理由两个寄存器组成的短整型数据时的注意事项。文章通过实例解释了整数在计算机中以补码形式存储的原理,以及在不同字节长度的数据类型间转换时,高位补位和低位截断的行为差异。强调了在处理负数时,符号位的正确处理对于避免数据错误的重要性。

推荐阅读:signed、unsigned 关键字

最近写代码的时候发现一个问题,我有一个数据是放在两个寄存器中的,一个表示高8位,一个表示低八位,我的这个数据是有符号的,那我在算出数据的时候就需要把两个寄存器的值进行合并了,这样就需要把数据从char 转换到short类型了。

现在假定我有两个char型数据ch1,ch2。需要把结果写入一个short型的数据data。假定ch1为低8位数据,ch2为高8位数据

最开始我是这样写的:

data = (((short)ch2 << 8) & 0xff00) | (short(ch1) & 0x00ff);

这样写数据总是不对,于是就查阅了一些资料,也加了一些log查看数据,最终发现了问题,今天就借这个机会总结一下数据转换的问题。

整数在计算机中是以二进制补码的方式表示的,以int型为例:

int有4个字节,最高位为符号位 0表示正,1表示负

举个例子+3在计算机里存储为0000 0000  0000 0000  0000 0000  0000 0011b;

负数为即将该负数的绝对值按位取反,然后加1,那么-3在计算机中的存储就为1111 1111  1111 1111  1111 1111 1111 1101b;

数据转换大致可分为两种

1:低字节向高字节转换

2:高字节像低字节转换

首先我们先分析第一种,低字节向高字节转换,这种转换方式会采取高位补位的方式

例如将char型的3(0000 0011b)转换成int型,那就是转换为(0000 0000  0000 0000  0000 0000  0000 0011b)

例如将char型的3(0000 0011b)转换成unsigned int型,那就是转换为(0000 0000  0000 0000  0000 0000  0000 0011b)

例如将char型的-3(1111 1101b)转换成int型,那就是转换为(1111 1111  1111 1111  1111 1111 1111 1101b)

例如将char型的-3(1111 1101b)转换成unsigned int型,那就是转换为(1111 1111  1111 1111  1111 1111 1111 1101b)

通过上面的例子我们可以看出,低字节向高字节转换,采取的补位方式会因为数据正负而有不同,其实就是补数据位,正数补0,负数补1。基于这种方式,我们在将char型的-3转换成unsigned int型的数据时就会出现错误。

第二种情况就是高字节向低字节转换,这种转换会采取直接截取的方式

这种情况比较容易理解这里就不多说。

现在回到最开始的问题

data = (((short)ch2 << 8) & 0xff00) | (short(ch1) & 0x00ff);

这个运算会有什么问题,首先我们知道ch1,ch2都是有符号的,如果两者都为负值,那我对ch1的处理就是有问题的,因为我在转换的时候会将ch1的符号位也当成了数据位来计算,就会出现差错。

所以我们在转换的时候如果遇到负数,要特别小心下符号位和数据位的区别

在内存中,charunsigned char都是一个字节,唯一的区别是,char的最高位为符号位,能表示-128~127;unsigned char没有符号位,能表示0~255 [^2]。 当charunsigned char强制转换int时,会有不同的表现。在表达式中,小于int的类会全部强制转换int再进行比较 [^1]。对于signed char(即char)类,提升为int后,符号位变成了数值位,负的signed char会变成较大的数值 [^1]。例如在比较中,原本的负signed char值在转换后可能会出现与预期不同的大小关系 [^1]。 以下是一个示例代码,展示了charunsigned char强制转换int后的差异: ```c #include <stdio.h> #define MAX 32 // 获取真值 void TruthValue(char b[], int x) { sprintf(b, "%d", x); } // 获取原码 void TrueForm(char b[], int x) { sprintf(b, "%X", x); } // 获取反码 void RadixMinus(char b[], int x) { int temp = ~x; sprintf(b, "%X", temp); } // 获取补码 void Complement(char b[], int x) { int temp = x < 0 ? ~x + 1 : x; sprintf(b, "%X", temp); } /* 检查uchar */ void CheckUchar(unsigned char uch) { int x; char b[MAX + 1]; x = uch; printf("CheckUchar Decimal value:%d\n", x); TruthValue(b, x); printf("TruthValue:\t%s\n", b); TrueForm(b, x); printf("TrueForm:\t%s\n", b); RadixMinus(b, x); printf("RadixMinus:\t%s\n", b); Complement(b, x); printf("Complement:\t%s\n", b); } /* 检查schar */ void CheckSchar(char sch) { int x; char b[MAX + 1]; x = sch; printf("CheckSchar Decimal value:%d\n", x); TruthValue(b, x); printf("TruthValue:\t%s\n", b); TrueForm(b, x); printf("TrueForm:\t%s\n", b); RadixMinus(b, x); printf("RadixMinus:\t%s\n", b); Complement(b, x); printf("Complement:\t%s\n", b); } int main() { unsigned char uch = -100; char sch = -100; printf("hex: uch = 0x%x, sch = 0x%x\n", uch, sch); printf("dec: uch = %d, sch = %d\n", uch, sch); CheckUchar(uch); CheckSchar(sch); return 0; } ``` 这个程序中,分别对unsigned charchar的变量赋值为-100,然后将它们强制转换int,并输出它们的十进制值、真值、原码、反码和补码,以此展示两者强制转换int后的差异 [^3]。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值