char的整形提升以及大小端的介绍

shylyly_

已于 2024-03-08 19:43:10 修改

阅读量185

点赞数

文章标签： c语言开发语言

于 2023-08-22 13:21:07 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/shylyly_/article/details/132425154

版权

文章介绍了计算机编程中不同类型数据（如整型、字符）的存储方式，包括原码、反码和补码的区别，以及大端和小端字节序的概念。通过实例展示了不同数据在内存中的存储情况，以及如何处理有符号和无符号整数的运算。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1. 数据类型介绍

前面我们已经学习了基本的内置类型：

char // 字符数据类型

short // 短整型

int // 整形

long // 长整型

long long // 更长的整形

float // 单精度浮点数

double // 双精度浮点数

1.1 类型的基本归类：

2. 整形在内存中的存储

我们之前讲过一个变量的创建是要在内存中开辟空间的。空间的大小是根据不同的类型而决定的。

那接下来我们谈谈数据在所开辟内存中到底是如何存储的？

比如：

int a = 20 ;

int b = - 10 ;

我们知道为 a 分配四个字节的空间。

那如何存储？

下来了解下面的概念：

2.1 原码、反码、补码

计算机中的整数有三种 2 进制表示方法，即原码、反码和补码。

三种表示方法均有 符号位 和 数值位 两部分，符号位都是用 0 表示 “ 正 ” ，用 1 表示 “ 负 ” ，而数值位

正数的原、反、补码都相同。

负整数的三种表示方法各不相同。

原码

直接将数值按照正负数的形式翻译成二进制就可以得到原码。

反码

将原码的符号位不变，其他位依次按位取反就可以得到反码。

补码

反码 +1 就得到补码。

对于整形来说：数据存放内存中其实存放的是补码。

为什么呢？

在计算机系统中，数值一律用补码来表示和存储。原因在于，使用补码，可以将符号位和数值域统

一处理；

同时，加法和减法也可以统一处理（ CPU 只有加法器 ）此外，补码与原码相互转换，其运算过程

是相同的，不需要额外的硬件电路。 //了解即可，不一定要记住

补码与原码相互转换，其运算过程是相同的，例如：

原码到补码，先取反，再+1。

常规的补码到原码，先-1，在取反，实际上也可以，先取反，再+1，所以说，补码和原码相互转换，其过程是相同的。

我们看看在内存中的存储：

我们可以看到对于num 和num2 分别存储的是补码。但是我们发现顺序有点 不对劲 。

这是又为什么？

2.2 大小端介绍

什么大端小端：

大端（存储）模式，是指数据的低位保存在内存的高地址中，而数据的高位，保存在内存的低地址

中；

小端（存储）模式，是指数据的低位保存在内存的低地址中，而数据的高位 , ，保存在内存的高地

址中。

为什么有大端和小端：

为什么会有大小端模式之分呢？这是因为在计算机系统中，我们是以字节为单位的，每个地址单元

都对应着一个字节，一个字节为 8 bit 。但是在 C 语言中除了 8 bit 的 char 之外，还有 16 bit 的 short

型， 32 bit 的 long 型（要看具体的编译器），另外，对于位数大于 8 位的处理器，例如 16 位或者 32

位的处理器，由于寄存器宽度大于一个字节，那么必然存在着一个如何将多个字节安排的问题。因

此就导致了大端存储模式和小端存储模式。

例如：一个 16bit 的 short 型 x ，在内存中的地址为 0x0010 ， x 的值为 0x1122 ，那么 0x11 为

高字节， 0x22 为低字节。对于大端模式，就将 0x11 放在低地址中，即 0x0010 中， 0x22 放在高

地址中，即 0x0011 中。小端模式，刚好相反。我们常用的 X86 结构是小端模式，而 KEIL C51 则

为大端模式。很多的 ARM ， DSP 都为小端模式。有些 ARM 处理器还可以由硬件来选择是大端模式

还是小端模式。 // 了解即可

所以：

大端（存储）模式，是指数据的低位保存在内存的高地址中，而数据的高位，保存在内存的低地址

中；（11 22 33 44）

小端（存储）模式，是指数据的低位保存在内存的低地址中，而数据的高位 , ，保存在内存的高地

址中：（44 33 22 11）

百度2015年系统工程师笔试题：

请简述大端字节序和小端字节序的概念，设计一个小程序来判断当前机器的字节序。（ 10 分）

如下：

思路在于1的的二进制（32位）转换为16进制后的（8位）的前面两位在大端和小端中有所差异，

将&a（a的地址也就是指针，原本是int *）强行转化位 char *，再对char * 进行解引用，此时 char *的权限只能访问到8个比特位，也就是两个16进制位，所以，不是01，就是00；

还有几个优化后的代码：

在函数里面直接return 了前两位16进制，不用再创建 * p。

对char再内存中的存储的讲解：（重点！）

有符号第一位为符号位，无符号无符号位，每一位都是数值位。

总结：sign char 的取值范围，00000000到11111111，因为第一位为符号位，所以范围是-128~127 。

总结：unsigned char 从00000000到11111111，因为无符号位的影响，所以均为正数，所以取值范围是0~255。

2.3 练习

1.

// 输出什么？

#include <stdio.h>

int main ()

{

char a = - 1 ;

signed char b =- 1 ;

unsigned char c =- 1 ;

printf ( "a=%d,b=%d,c=%d" , a , b , c );

return 0 ;

}

输出结果为 -1 -1 255

讲解：

有符号char整形提升高位全部按照char的第一位来补！

无符号char整形提升高位全部补0！

2.

#include <stdio.h>

int main ()

{

char a = - 128 ;

printf ( "%u\n" , a );

return 0 ;

}----------》答案是很大一个数字

注意：%u是按照10进制打印无符号整数！

此时的补码，因为以无符号整形打印，所以补码就是原码！

3.

#include <stdio.h>

int main ()

{

char a = 128 ;

printf ( "%u\n" , a );

return 0 ;

} -------》结果也是上个问题的结果，因为截断后的8个二进制位一模一样！

4.

int i = - 20 ;

unsigned int j = 10 ;

printf ( "%d\n" , i + j );

// 按照补码的形式进行运算，最后格式化成为有符号整数

结果是-10，正常计算即可，或用补码相加，再求出原码也行。

5.

unsigned int i ;

for ( i = 9 ; i >= 0 ; i -- )

{

printf ( "%u\n" , i );

}

前面说过，unsighed char 无负数，unsigned int 也一样，所以当应该是-1的时候，其的补码就是32个二进制位都为1，而以无符号数打印（%u），所以补码就是原码，判断永远>=0，所以死循环

6.

int main ()

{

char a [ 1000 ];

int i ;

for ( i = 0 ; i < 1000 ; i ++ )

{

a [ i ] = - 1 - i ;

}

printf ( "%d" , strlen ( a ));

return 0 ;

}------》结果为255

char 的取值范围为-128~127，所以从-1到-128的时候，再下一位就是127了，然后127到0，在下一位就是-1了，然后就是-1~-128，如此循环，到1000次，而strlen是以\0位判断标志，所以到0的时候就会停，所以答案是255。

7.

#include <stdio.h>

unsigned char i = 0 ;

int main ()

{

for ( i = 0 ; i <= 255 ; i ++ )

{

printf ( "hello world\n" );

}

return 0 ;

}

结果为， hello world死循环，因为unsighed char的取值范围为0~255，所以，永远不可能突破限制条件。

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。