整数与浮点数在内存中的存储_利用联合体的特点,查看整数和浮点数的内存实际存储情况-优快云博客

很简单，在电脑中数据是要有空间来存储的，我们以字节为单位，每个地址对应一个字节，一个字节就是8bit，在c语言中除了8bit的char，还有16bit 的short，32bit 的int。另外，对于位数⼤于8位的处理器，例如16位或者32位的处理器，由于寄存器宽度大于⼀个字节，那么必然存在着⼀个如何将多个字节安排的问题。因此就导致了⼤端存储模式和⼩端存储模式。

3.3如何判断当前环境是大端还是小端

通过下面代码可以查看我们的环境是大端还是小端。

代码3-1：

#include <stdio.h>
int check_sys()
{
     int i = 1;
     return (*(char *)&i);
}
int main()
{
     int ret = check_sys();
     if(ret == 1)
     {
         printf("⼩端\n");
     }
     else
     {
         printf("⼤端\n");
     }
     return 0;
}

在check_sys函数里整形i的存放有俩种的情况：

1.大端：00 00 00 01

2.小端：01 00 00 00

我们使用return (*(char*)&i)返回第一个字节,即查看第一个字节是否为01，在main函数里ret来接收，如果返回的字节是00那么我们ret的结果就是0；如果返回的字节是01，那么ret的结果是1；接着就是大端和小端的判断。

我们介绍另一种方法，介绍之前我们得先了解一下什么叫做联合体。

联合体union就和struct一样是可以创建很多变量。

union s
{
    int i;
    char c;
}un = {10 , 10};

这个联合体的类型就是我们union s 。un是我们创建的变量，它的类型是union s。我们只要记住在union s里面的空间是共用的，int是里面的最大字节。所以空间的大小最少是4个字节。

int check_sys()
{
    union s
     {
     int i;
     char c;
     }un;
     un.i = 1;
 return un.c;
}

我们给i赋值为1;那它的存储方式就有俩种和上面介绍的一样。因为c变量和i变量的空间是共用的。所以当我们返回的值是1时那我们的环境就是小端。否则大端。

3.4练习（整型提升）

我们给出下面俩段代码：

//代码1
#include <stdio.h>
int main()
{
     char a = -128;
     printf("%u\n",a);
     return 0;
}


//代码2
#include <stdio.h>
int main()
{
     char a = 128;
     printf("%u\n",a);
     return 0;
}

它们的运行结果是什么？

我们知道char是一个字节，一个字节就是8bit：0000 0000 . 当符号位是0时。

我们最大就是0111 1111 ，转换为二进制就是127，那么最小就时1000 0000，就是-128.那么我们可以知道当考虑符号位时char的取值范围就是-128~127这是考虑符号位。那如果我们不考虑符号位char的取值范围是多少呢？最小就0；最大就是1111 1111 就是255.因此就是0~255.

我们可以通过这个图来理解取值范围：

无符号的就是0~255来循环。

分析到这我们可以知道，俩个代码中的范围都超过了char的范围。代码1的运行结果会不会就是将-号去掉呢？代码二结果就是128呢？

我们运行试一下：

我们发现解果都是一个很大的数，这又是为什么呢？很简单，我们要知道我们给变量赋值的是一个整数。而且%u的意思是十进制的形式打印无符号整数。而char类型只有一个字节，以整数的形式打印要发生整型提升。什么是整型提升呢？我们只需要记住，表达式中的字符和短整型操作数在使⽤之前被转换为普通整型。

如何进行整形提升呢？

1. 有符号整数提升是按照变量的数据类型的符号位来提升的

2. ⽆符号整数提升，⾼位补0

//负数的整形提升 char c1 = -1;

变量c1的⼆进制位(补码)中只有8个⽐特位： 1111111

因为 char 为有符号的 char

所以整形提升的时候，⾼位补充符号位，即为1 提升之后的结果是：

1111 1111 1111 1111 1111 1111 1111 1111

//正数的整形提升 char c2 = 1;

变量c2的⼆进制位(补码)中只有8个⽐特位： 00000001

因为 char 为有符号的 char

所以整形提升的时候，⾼位补充符号位，即为0 提升之后的结果是：

0000 0000 0000 0000 0000 0000 0000 0001

//⽆符号整形提升，⾼位补0

再来看上面的代码1和代码2：

代码中的变量都是有符号的（在vs下默认未标明的char是有符号的，在其他的编译器则不一定）

而我们打印的时候都是用的%u符号，所以要发生整形提升。

代码1中：

因为是负数-128（是个整数）。

-128的原码是1000 0000 0000 0000 0000 0000 1000 0000

反码+1 == 补码就是 1111 1111 1111 1111 1111 1111 0111 1111 + 1

补码 1111 1111 1111 1111 1111 1111 1000 0000

最终我们的a变量里面是1000 0000；

然后打印时有一次发生整形提升，有符号char，补符号位1：1111 1111 1111 1111 1111 1111 1000 0000。

因为使用的是%u，打印的是无符号数，因此打印的就是char整形提升之后的十进制。

代码2中：
因为是正数：128.

补码，反码，原码都一样：0000 0000 0000 0000 0000 0000 1000 0000

最终a变量是：1000 0000。

然后打印时有一次发生整形提升，有符号char，补符号位1：1111 1111 1111 1111 1111 1111 1000 0000。

因为使用的是%u，打印的是无符号数，因此打印的就是char整形提升之后的十进制。

看下面的代码：

#include <stdio.h>
#incldue <string.h>
int main()
{
     char a[1000];
     int i;
     for(i=0; i<1000; i++)
     {
         a[i] = -1-i;
     }
     printf("%d",strlen(a));//找到\0为止，\0的ASCII值就是0；
     return 0;
}

上面的代码中每一个元素都是有符号的char类型变量。那每一个范围都是-128~127. i 从0开始。每次a[0] = -1；a[1] = -2;......;a[i] = -128 。当a[i]是-128再次给它-1时已经超出范围了。那它的值是多少呢？我们通过补码来运算。-128的原码是:1000 0000 0000 0000 0000 0000 1000 0000;

补码是：1111 1111 1111 1111 1111 1111 1000 0000;则-128 - 1 的补码就是1111 1111 1111 1111 1111 1111 0111 1111.将它赋值给char 类型的a[i]；最终a[i] 是0111 1111;这个值是补码。当时它的符号位是0，因此原码和补码一样，值的大小是127，我们发现它似乎是一个循环就如我们分析char类型的取值范围一样。

因此a数组的赋值结果是-1，-2，......,-128,127,126,......0,-1,-2,.....,-128,127........的循环.

因为strlen找的是‘\0’。ASCII的值是0，因此找到0时就停下来了。所以大小是255。

接下来看这俩段代码：

//代码3
#include <stdio.h>
unsigned char i = 0;
int main()
{
     for(i = 0;i<=255;i++)
     {
         printf("hello world\n");
     }
     return 0;
}


//代码4
#include <stdio.h>
int main()
{
     unsigned int i;
     for(i = 9; i >= 0; i--)
     {
         printf("%u\n",i);
     }
     return 0;
}

同样的道理，它们都超出了范围。代码3中i的值不会超过255，当255进入时加1，结果就是0；会死循环。代码4中的i值不会时负数，最终也会是死循环。

再给出一段代码

#include <stdio.h>
int main()
{
     int a[4] = { 1, 2, 3, 4 };
     int *ptr1 = (int *)(&a + 1);
     int *ptr2 = (int *)((int)a + 1);
     printf("%x,%x", ptr1[-1], *ptr2);
     return 0;
}

要知道它的输出结果，最好通过画图来推断。

分析ptr1的位置，因为&a表示整个数组的地址，整个数组的地址加1，表示跳过整个数组。则ptr1指向的位置如图。

分析ptr2，因为a表示数组名，数组名表首元素地址。给首元素的地址强制转换类型为int，因为地址是16进制的数字，转化为一个整形再加1，假设首元素地址是0x11，那么这个整形加1就是0x12.最后将0x12转化为int*的地址数字给ptr2.则如图

ptr2指向的空间就是蓝框之类的。这个数字就是0x02000000.

所以最终我们输出的结果就是就是0x04000000 和 0x02000000.但是再vs这个严谨的编译器里，结果会报错。

四、浮点型在数据中的存储

介绍完整形在内存中的存储方式，那小数（浮点型）是怎么存储的呢？

常⻅的浮点数：3.14159、1E10等，浮点数家族包括： float、double、long double 类型。浮点数表⽰的范围： float.h 中定义。

我们知道一个整数的二进制如7是 0111 。那7.5的二进制是多少？在我们将二进制转化为十进制的时候我们通常是用权重的方法。即0111，的最后一位是1 x 2的0次方，第二位就是1 x 2的1次方。结果就是1x2^2 + 1 x 2^1 + 1 x 2^0 = 7。那在2^0之后就是2^-1 .... 2^-2。所以7.5就是0111.1，即1x2^2 + 1 x 2^1 + 1 x 2^0 + 1 x 2^-1 = 7.5 。

给出下面的代码

#include <stdio.h>
int main()
{
     int n = 9;
     float *pFloat = (float *)&n;
     printf("n的值为：%d\n",n);
     printf("*pFloat的值为：%f\n",*pFloat);
     *pFloat = 9.0;
     printf("num的值为：%d\n",n);
     printf("*pFloat的值为：%f\n",*pFloat);
     return 0;
}

创建变量n后，&n，将地址强转为（float*），我们知道float是8（64位）个字节，那么*pFloat的结果是否为9.000000呢？

给*pFloat赋值为9.0，n的值会不会改变成9.000000呢？当我们运行之后发现结果和我们想的完全不同

这是为什么呢？

4.1浮点数的储存

上⾯的代码中， num 和 *pFloat 在内存中明明是同⼀个数，为什么浮点数和整数的解读结果会差别这么⼤？要理解这个结果，⼀定要搞懂浮点数在计算机内部的表⽰⽅法

根据国际标准IEEE（电⽓和电⼦⼯程协会） 754，任意⼀个⼆进制浮点数V可以表⽰成下⾯的形式：

• (−1)S 表⽰符号位，当S=0，V为正数；当S=1，V为负数

• M 表⽰有效数字，M是⼤于等于1，⼩于2的

• 2 ^E 表⽰指数位。

举个例，十进制的7.0，写成⼆进制是 111.0 ，相当于 1.11×2^2 。那么，按照上⾯V的格式，可以得出S=0，M=1.11，E=2。

0 10000010 11000000000000000000000

十进制的-7.0，写成⼆进制是 -111.0 ，相当于 -1.11×2^2 。那么，S=1，M=1.11，E=2。

1 10000010 11000000000000000000000

IEEE 754规定：

对于32位的浮点数，最⾼的1位存储符号位S，接着的8位存储指数E，剩下的23位存储有效数字M

对于64位的浮点数，最⾼的1位存储符号位S，接着的11位存储指数E，剩下的52位存储有效数字M

4.2浮点数存的过程

IEEE 754 对有效数字M和指数E，还有⼀些特别规定。

前⾯说过， 1≤M<2 ，也就是说，M可以写成 1.xxxxxx 的形式，其中 xxxxxx 表⽰⼩数部分。 IEEE 754 规定，在计算机内部保存M时，默认这个数的第⼀位总是1，因此可以被舍去，只保存后⾯的 xxxxxx部分。⽐如保存1.01的时候，只保存01，等到读取的时候，再把第⼀位的1加上去。这样做的⽬的，是节省1位有效数字。以32位浮点数为例，留给M只有23位，将第⼀位的1舍去以后，等于可以保存24位有效数字。

⾄于指数E，情况就⽐较复杂

首先，E为⼀个⽆符号整数（unsigned int）

这意味着，如果E为8位，它的取值范围为0~255；如果E为11位，它的取值范围为0~2047。但是，我们知道，科学计数法中的E是可以出现负数的，所以IEEE 754规定，存⼊内存时E的真实值必须再加上⼀个中间数，对于8位的E，这个中间数是127；对于11位的E，这个中间数是1023。⽐如，2^10的E是 10，所以保存成32位浮点数时，必须保存成10+127=137，即10001001。

4.3 浮点数取的过程

指数E从内存中取出还可以再分成三种情况：

E不全为0或不全为1：

这时，浮点数就采⽤下⾯的规则表示，即指数E的计算值减去127（或1023），得到真实值，再将有效数字M前加上第⼀位的1。

比如：0.5 的⼆进制形式为0.1，由于规定正数部分必须为1，即将⼩数点右移1位，则为1.0*2^(-1)，其阶码为-1+127(中间值)=126，表⽰为01111110，⽽尾数1.0去掉整数部分为0，补⻬0到23位 00000000000000000000000，