C语言：数据在内存中的存储-优快云博客

正整数的原、反、补码都相同。
负整数的三种表⽰方法各不相同。
原码：直接将数值按照正负数的形式翻译成⼆进制得到的就是原码。我们通过printf打印出来的数值就是原码
反码：将原码的符号位不变，其他位依次按位取反就可以得到反码。
补码：反码+1就得到补码。对于整形来说：数据存放内存中其实存放的是补码，运算都是用补码的方式进行。

2. 大小端字节序和字节序判断

#include <stdio.h>
int main()
{
 int a = 0x11223344;
 
 return 0;
}

调试的时候，我们可以看到在a中的 0x11223344 这个数字是按照字节为单位，倒着存储的。这是为什么呢？这里要引入大小端的概念

2.1 什么是大小端？

其实超过⼀个字节的数据在内存中存储的时候，就有存储顺序的问题，按照不同的存储顺序，我们分为⼤端字节序存储和小端字节序存储，下⾯是具体的概念：

大端（存储）模式：是指数据的低位字节内容保存在内存的⾼地址处，⽽数据的高位字节内容，保存在内存的低地址处。

小端（存储）模式：是指数据的低位字节内容保存在内存的低地址处，⽽数据的高位字节内容，保存在内存的高地址处。上述概念需要记住，⽅便分辨⼤⼩端。

简单来说，小端就是倒着存，大端就是正者存。如果int a = 0x11223344

那么小端就是

44 33 22 11

大端就是

11 22 33 44

2.2练习字节序判断

2.2.1 练习1

请简述⼤端字节序和⼩端字节序的概念，设计⼀个⼩程序来判断当前机器的字节序。（10分）-百度笔试题


#include <stdio.h>
int check_sys()
{
 int i = 1;
 return (*(char *)&i);
}
int main()
{
 int ret = check_sys();
 if(ret == 1)
 {
 printf("⼩端\n");
 }
 else
 {
 printf("⼤端\n");
 }
 return 0;
}

分析：

代码中的check_sys()函数通过创建一个整型变量i，并将其地址转换为char类型指针，然后通过解引用该指针获取到存储在内存中的第一个字节。由于char类型占用一个字节，所以可以通过判断该字节的值来确定系统的字节序。

在主函数main()中，调用check_sys()函数并将返回值赋给变量ret。如果ret等于1，则说明系统采用小端序，即低地址存放最低有效字节；否则，系统采用大端序，即高地址存放最低有效字节。根据判断结果，会输出相应的提示信息。

2.2.2 练习2

#include <stdio.h>
int main()
{
 char a= -1;
 signed char b=-1;
 unsigned char c=-1;
 printf("a=%d,b=%d,c=%d",a,b,c);
 return 0;
}

运行结果：

分析：

char与 signed char 类型可储存的数在-128~127以内，所以-1可以被正确地赋值给a，b。

变量c被声明为unsigned char类型，并同样初始化为-1。unsigned char类型是无符号的，范围通常是0到255。由于-1是一个负数，但unsigned char类型不能表示负数，因此会发生截断（溢出）

对255结果的解析：

变量c的⼆进制位(补码)中只有8个⽐特位：

1111 1111

因为 unsigned char 为无符号的 unsigned char ，所以整形提升的时候，⾼位补充0。

0000 0000 0000 0000 0000 0000 1111 1111

之后直接发生截断（8个⽐特位）

1111 1111

则c就为255

2.2.3 练习3

#include <stdio.h>
int main()
{
 char a = -128;
 printf("%u\n",a);
 return 0;
}

#include <stdio.h>
int main()
{
 char a = 128;
 printf("%u\n",a);
 return 0;
}

运行结果都是：

分析：

char与 signed char 类型可储存的数在-128~127以内，这里的a也发生截断（溢出）

变量-128的⼆进制位(原码)为：

1000 0000 0000 0000 0000 0000 1000 0000

补码为：

1111 1111 1111 1111 1111 1111 1000 0000

存在char类型内，变量a的⼆进制位(补码)中只有8个⽐特位：

1000 0000

在打印时会发生整形提升，因为char类型为有符号数，会以符号位进行填充，⾼位补充1

1111 1111 1111 1111 1111 1111 1000 0000

最后以unsigned int的形式打印出来，因为 unsigned int原反补的形式相同，就会直接打印

可以看到结果就是这个大到夸张的数吗，128同理，其在打印时整型提升后完全相同，故而结果相同

2.3.4 练习4

#include <stdio.h>
int main()
{
 char a[1000];
 int i;
 for(i=0; i<1000; i++)
{
 a[i] = -1-i;
 }
 printf("%d",strlen(a));
 return 0;
}

运行结果：

分析

a表面上存的数组为[ -1，-2，......-1001]，但a是char类型的数组，其接受数值范围为-128~127，所以数值在不断的-1后，到了-129，值就会发生变化，如图所示是个循环：

而strlen会计算到‘\0’，也就是0才会停止计算，则计算结果为255

2.3.6 练习5

#include <stdio.h>
int main()
{
 int a[4] = { 1, 2, 3, 4 };
 int *ptr1 = (int *)(&a + 1);
 int *ptr2 = (int *)((int)a + 1);
 printf("%x,%x", ptr1[-1], *ptr2);
 return 0;
}

运行结果：

分析：

&a取出了a数组的地址，使其+1,正好跳过a的最后一个元素到a数组后的第一个元素，并交给了ptr指针，则ptr[-1]是ptr指针的前一个元素，也就是a的最后一个元素，即为4。

而对于*ptr2的结果有些复杂：

（int）&a的涵义是，将a的地址取出，并强制转换为int 类型，使其地址以十进制的方式呈现，并令其+1，也就是地址+1，走了一个字节。

为了方便理解，举个小例子：

假设a的地址为 Ox 010(十六进制),强制转换为 016（十进制）,+1，变为 017，从地址的角度，前进了一个字节

回到题目，我们看看a数组的地址分配，以vs的小端为例：

原先&a在处：

(int)a + 1使箭头向后移动1字节：

并使其强转为int*，交给了ptr2，又因int*类型访问4个字节的地址，则ptr2解引用的访问的是这个范围的地址：

以十六进制所打印，结果就为02 00 00 00 。

3. 浮点数在内存中的存储

先来看一段代码：

#include <stdio.h>
int main()
{
 int n = 9;
 float *pFloat = (float *)&n;
 printf("n的值为：%d\n",n);
 printf("*pFloat的值为：%f\n",*pFloat);
 *pFloat = 9.0;
 printf("num的值为：%d\n",n);
 printf("*pFloat的值为：%f\n",*pFloat);
 return 0;
}

运行结果：

n的值为：9
*pFloat的值为：0.000000
num的值为：1091567616
*pFloat的值为：9.000000

3.1 浮点数的存储

上⾯的代码中， num 和 *pFloat 在内存中明明是同⼀个数，为什么浮点数和整数的解读结果会差别这么⼤？

要理解这个结果，⼀定要搞懂浮点数在计算机内部的表⽰⽅法

举例来说：

⼗进制的5.0，写成⼆进制是 101.0 ，相当于 1.01×2^2 。那么，按照上⾯V的格式，可以得出S=0，M=1.01，E=2。

⼗进制的-5.0，写成⼆进制是 -101.0 ，相当于 -1.01×2^2 。那么，S=1，M=1.01，E=2

IEEE 754规定：

对于32位的浮点数，最⾼的1位存储符号位S，接着的8位存储指数E，剩下的23位存储有效数字M
对于64位的浮点数，最⾼的1位存储符号位S，接着的11位存储指数E，剩下的52位存储有效数字M

3.1.1 浮点数存的过程

IEEE 754 对有效数字M和指数E，还有⼀些特别规定。

前⾯说过，1≤M<2 ，也就是说，M可以写成 1.xxxxxx 的形式，其中 xxxxxx 表⽰⼩数部分。IEEE 754 规定，在计算机内部保存M时，默认这个数的第⼀位总是1，因此可以被舍去，只保存后⾯的 xxxxxx部分。⽐如保存1.01的时候，只保存01，等到读取的时候，再把第⼀位的1加上去。这样做的⽬的，是节省1位有效数字。以32位浮点数为例，留给M只有23位，将第⼀位的1舍去以后，等于可以保存24位有效数字。

⾄于指数E，情况就⽐较复杂

⾸先，E为⼀个⽆符号整数（unsigned int）

这意味着，如果E为8位，它的取值范围为0~255；如果E为11位，它的取值范围为0~2047。但是，我们知道，科学计数法中的E是可以出现负数的，所以IEEE 754规定，存⼊内存时E的真实值必须再加上⼀个中间数，对于8位的E，这个中间数是127；对于11位的E，这个中间数是1023。⽐如，2^10的E是 10，所以保存成32位浮点数时，必须保存成10+127=137，即10001001。

3.1.2 浮点数取的过程

指数E从内存中取出还可以再分成三种情况：

E不全为0或不全为1：

这时，浮点数就采⽤下⾯的规则表⽰，即指数E的计算值减去127（或1023），得到真实值，再将有效数字M前加上第⼀位的1。⽐如：0.5 的⼆进制形式为0.1，由于规定正数部分必须为1，即将⼩数点右移1位，则为1.0*2^(-1)，其阶码为-1+127(中间值)=126，表⽰为01111110，⽽尾数1.0去掉整数部分为0，补⻬0到23位 00000000000000000000000，则其⼆进制表⽰形式为:

0 01111110 00000000000000000000000

E全为0

这时，浮点数的指数E等于1-127（或者1-1023）即为真实值，有效数字M不再加上第⼀位的1，⽽是还原为0.xxxxxx的⼩数。这样做是为了表⽰±0，以及接近于0的很⼩的数字。

0 00000000 00100000000000000000000

E全为1

这时，如果有效数字M全为0，表⽰±⽆穷⼤（正负取决于符号位s）；

0 11111111 00010000000000000000000

3.2题目分析

现在我们实际分析一下题目结果：

float *pFloat = (float *)&n;

*pFloat的值为：0.000000

将n的整形二进制表达，⾸先，将 9 的⼆进制序列按照浮点数的形式拆分，得到第⼀位符号位s=0，后⾯8位的指数 E=00000000 ，最后23位的有效数字M=

00000000000000000000000000001001

由于指数E全为0，所以符合E为全0的情况。因此，浮点数V就写成：

V=(-1)^0 × 0.00000000000000000001001×2^(-126)=1.001×2^(-146)

显然，V是⼀个很⼩的接近于0的正数，所以⽤⼗进制⼩数表⽰就是0.000000。

*pFloat = 9.0;
 printf("num的值为：%d\n",n);
 printf("*pFloat的值为：%f\n",*pFloat);

num的值为：1091567616
*pFloat的值为：9.000000

通过*pFloat，以浮点数的二进制形式修改num，

浮点数9.0 等于⼆进制的1001.0，即换算成科学计数法是：1.001×2^3

由

得 9.0=（-1）^0 *1.0*(2^3)

那么，第⼀位的符号位S=0，有效数字M等于001后⾯再加20个0，凑满23位，指数E等于3+127=130，即10000010

所以，写成⼆进制形式，应该是S+E+M，即

0 10000010 001 0000 0000 0000 0000 0000

这个32位的⼆进制数，被当做整数来解析的时候，就是整数在内存中的补码，原码正是 1091567616 。

所以num的值为：1091567616。

感谢你能看到这里！

C语言： 数据在内存中的存储

1. 整数在内存中的存储

2. 大小端字节序和字节序判断

2.1 什么是大小端？

2.2练习字节序判断

2.2.1 练习1

2.2.2 练习2

2.2.3 练习3

2.3.4 练习4

2.3.6 练习5

3. 浮点数在内存中的存储

3.1 浮点数的存储

3.1.1 浮点数存的过程

3.1.2 浮点数取的过程

3.2题目分析

3 条评论

C语言：数据在内存中的存储