C语言中的类型提升——基础概念,但还有很多人搞不清

本文详细探讨了C语言中类型提升的概念及其在实际编程中的应用,通过实例展示了如何正确理解和处理类型提升带来的影响,包括从字符类型到无符号整型的提升过程和原理。同时,对比了不同类型的混合运算可能导致的溢出问题,并提供了避免此类问题的策略。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

每天都会看CU的博客,尤其是CU首页上面的博客。个人感觉有很多同学并不关注基础知识,
在遇到问题时,经常会舍本求末。遇到问题,总是找不到根本原因,得出了一些结论。但这些结论并不是真正的原因,整个儿过程,也把真正的原因给掩盖了。

今天主要说一下C语言的类型提升的事情。

下面是引用的一个例子——这个代码是从一个朋友的博文中复制过来的,但是当时这位朋友没有去说明类型提升的问题,而是阐述汇编的过程。
/***************************************************************/
int main()
{
int i;
unsigned char *p;
char *p1;
int a[] = {0xffffffff, 0xffffffff, 0xffffffff};
p = a;
p1 = a;
for(i = 0 ; i < 8 ; i++) {
printf(" 0x%02x  0x%02x \n", p[i], p1[i]);
}
}
$ gcc main.c 
main.c: In function ‘main’:
main.c:10: warning: assignment from incompatible pointer type
main.c:11: warning: assignment from incompatible pointer type
$ ./a.out 
 0xff  0xffffffff 
 0xff  0xffffffff 
 0xff  0xffffffff 
 0xff  0xffffffff 
 0xff  0xffffffff 
 0xff  0xffffffff 
 0xff  0xffffffff 
 0xff  0xffffffff 
。。。。。。 。。。。。。
/***************************************************************/

根本原因其实很简单。
%x是打印无符号整数的16进制,而例子中传递的类型是字符型,那么这里就有一个字符提升的问题,将类型提升为无符号整形。
*p是unsigned char,其值为0xff,那么对应的无符号整形的值仍然是0xff。
而*p1确实char,其值为0xff,其对应的无符号整形的值为0xffffffff。为什么这次是0xffffffff呢?
因为*p1为-1,而无符号整数的-1则是0xffffffff。

为什么是这样呢?
因为在在编码为补码的情形下,类型提升有两种情况:
1. 符号扩展:对于有符号数,扩展存储位数的方法。在新的高位字节使用当前最高有效位即符号位的值进行填充。
2. 零扩展:对于无符号数,扩展存储位数的方法。在新的高位直接填0.

对于这个例子来说。*p是无符号数,所以填充的是0,即为0x000000ff。而*p1是有符号数,所以填充的是1,即为0xffffffff。

因此,从char型到unsigned int,是对有符号数的提升,因此用的是符号扩展,oxff被扩展为oxffffffff;而从unsigned char型到unsigned int型,是对无符号数的扩展,使用零扩展,oxff被扩展为ox000000ff,而填充的这些零是不会被打印出来的。

如果说这样教科书式的概念不容易理解。还有这样一种理解方式,也许不一定准确,但更容易理解。
对于这里的类型提升,整个步骤可以这样理解:
1. %x要求参数为无符号整数,需要参数为4个字节;
2. *p, *p1为(unsigned) char型,只占1个字节;
3. 因为参数的类型不符,需要扩展;
4. 定位需要扩展到4个字节;
5. 那么就需要填充增加的3个字节;
6. 这3个字节需要什么值?这里就需要上面所需要的概念了。针对有符号数和无符号数,进行不同值的填充。

这就是为什么在编程的过程中,要避免有符号数和无符号数的混用。我个人认为,在我们解决问题的时候,不要一味儿的想着怎么用高级的技术解决。其实最重要的是基础。一般情况下,大部分的问题都可以由C语言基础解决。

接下来再看一个例子:

     1  #include <stdio.h>
     2
     3  int main(int argc, char **argv){
     4          int a=1000000,b=1000000;
     5          long int c,c1,c2,c3;
     6          c=a*b;//note1
     7          c1=(long)a*b;//note2
     8          c2=(long)a*(long)b;//note3
     9          c3=(long)(a*b);//note4
    10          printf("c=%ld, c1=%ld,c2=%ld, c3=%ld\n",c,c1,c2,c3);
    11          return 0;
    12  }

运行结果:

c=-727379968, c1=1000000000000,c2=1000000000000, c3=-727379968

note1和note4的打印结果是一样的,原理也是一样的,只不过在代码里note1是隐式类型转换,note4是显式类型转换,此处a*b的结果位数大于int的32位的范围,发生了溢出,高于第31位的数值丢弃,剩下的在进行符号扩展,最后显示为-727379968。而note2和note3,在计算出a*b的结果之前将a或b扩展为long型,提前避免了溢出问题,最后显示为1000000000000。

结束!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值