在数学中,数字有正负之分。在C语言中也是一样,short、int、long 都可以带上符号,例如:
如果不带正负号,默认就是正数。
符号也要在内存中体现出来。符号只有正负两种情况,用1位就足以表示,这1位就是最高位。以 int 为例,它占用32位的内存,0~30位表示数值,31 位表示正负号。如下图所示:
如果不希望设置符号位,可以在数据类型前面加 unsigned,如下所示:
这样,short、int、long 中就没有符号位了,所有的位都用来表示数值。也就意味着,使用了 unsigned 只能表示正数,不能表示负数了。
如果是
输出结果:
a1=1234, a1(u)=1234
a2=-1234, a2(u)=4294966062
b1=5678, b1(u)=5678
b2=-5678, b2(u)=4294961618
可以发现,无论变量声明为有符号数还是无符号数,只有当以 %u 格式输出时,才会作为无符号数处理;如果声明为 unsigned 却以 d% 输出,那么也是有符号数。
当数值过大或过小时,有限的几个字节就不能表示,就会发生溢出。发生溢出时,最高位会被截去。请看下面的例子:
- short a = -10; //负数
- int b = +10; //正数
- long c = (-9) + (+12); //负数和正数相加
short a = -10; //负数 int b = +10; //正数 long c = (-9) + (+12); //负数和正数相加
符号也要在内存中体现出来。符号只有正负两种情况,用1位就足以表示,这1位就是最高位。以 int 为例,它占用32位的内存,0~30位表示数值,31 位表示正负号。如下图所示:

在编程语言中,计数往往是从0开始,例如字符串 "abc123",我们称第 0 个字符是 a,第 1 个字符是 b,第 5 个字符是 3。这和我们平时从 1 开始计数的习惯不一样,大家要慢慢适应,培养编程思维。在符号位中,用0表示正数,用1表示负数。例如 int 类型的 -10、+16 在内存中的表示如下:

如果不希望设置符号位,可以在数据类型前面加 unsigned,如下所示:
- unsigned short a = 12;
- unsigned int b = 1002;
- unsigned long c = 9892320;
unsigned short a = 12; unsigned int b = 1002; unsigned long c = 9892320;
如果是
unsigned int
,那么可以省略 int ,只写 unsigned,例如:
unsigned n = 100;它等价于:
unsigned int n = 100;输出无符号数使用
%u
,代码如下:
- #include <stdio.h>
- #include <stdlib.h>
- int main()
- {
- int a1 = 1234, a2 = -1234;
- unsigned int b1 = 5678, b2 = -5678;
- printf("a1=%d, a1(u)=%u\n", a1, a1);
- printf("a2=%d, a2(u)=%u\n", a2, a2);
- printf("b1=%d, b1(u)=%u\n", b1, b1);
- printf("b2=%d, b2(u)=%u\n", b2, b2);
- return 0;
- }
#include <stdio.h> #include <stdlib.h> int main() { int a1 = 1234, a2 = -1234; unsigned int b1 = 5678, b2 = -5678; printf("a1=%d, a1(u)=%u\n", a1, a1); printf("a2=%d, a2(u)=%u\n", a2, a2); printf("b1=%d, b1(u)=%u\n", b1, b1); printf("b2=%d, b2(u)=%u\n", b2, b2); return 0; }
a1=1234, a1(u)=1234
a2=-1234, a2(u)=4294966062
b1=5678, b1(u)=5678
b2=-5678, b2(u)=4294961618
可以发现,无论变量声明为有符号数还是无符号数,只有当以 %u 格式输出时,才会作为无符号数处理;如果声明为 unsigned 却以 d% 输出,那么也是有符号数。
a2、b2 的输出值之所以很奇怪,与它们在内存中的存储形式有关,我们将在《 C语言整数在内存中是如何存储的》一节详细介绍。最后需要说明的是:不管是否有符号,%o、%x、%X、%#o、%#x、%#X 都是以无符号形式输出,读者可以亲自测试。
取值范围和数据溢出
short、int、long 占用的字节数不同,所能表示的数值范围也不同。以32位平台为例,下面是它们的取值范围:数据类型 | 所占字节数 | 取值范围 |
---|---|---|
short | 2 | -32768~32767,即 -215~(215-1) |
unsigned short | 2 | 0~65535,即 0~(216-1) |
int | 4 | -2147483648~2147483647,即 -231~(231-1) |
unsigned int | 4 | 0~4294967295,即0~(232-1) |
long | 4 | -2147483648~2147483647,即 -231~(231-1) |
unsigned long | 4 | 0~4294967295,即0~(232-1) |
当数值过大或过小时,有限的几个字节就不能表示,就会发生溢出。发生溢出时,最高位会被截去。请看下面的例子:
- #include <stdio.h>
- int main()
- {
- unsigned int a = 0x100000000;
- int b = 0xffffffff;
- printf("a=%u, b=%d\n", a, b);
- return 0;
- }
#include <stdio.h> int main() { unsigned int a = 0x100000000; int b = 0xffffffff; printf("a=%u, b=%d\n", a, b); return 0; }
运行结果:
a=0, b=-1
变量 a 为 int 类型,占用4个字节(32位),能表示的最大值为 0xFFFFFFFF,而 0x100000000 = 0xFFFFFFFF + 1,占用33位,已超出 a 所能表示的最大值,会发生溢出,最高位被截去,剩下的32位都是0。也就是说,在 a 被输出前,其值已经变成了 0。
对于变量 b,每一位的值都是 1,包括符号位,以 %d 输出时,按照推理应该是 -0x7fffffff = -2147483647,但是输出结果却是 -1,这是为什么呢?我们将在《C语言整数在内存中是如何存储的》一节解开谜底。