一、前言
我们都知道,数据存储在内存中,而计算机只认识0与1,那么数据在内存中的存储是什么样的呢?接下来本文章讲述整数、浮点数、大端与小端的存储方式,若是有一些东西没有讲到,也请大家多多海涵!
二、整数在内存中的存储
我们在文章《操作符详解》中介绍过了整数的二进制表示方式有三种:原码、反码、补码,这里我就再简单介绍一下:
有符号的整数,三种表示方法均有符号位和数值位两部分,符号位都是用0表示“正”,用1表示“负”,最高位的一位是被当做符号位,剩余的都是数值位。
- 正整数的原码、反码、补码都相同
- 负整数的原码、反码、补码都不同
原码、反码、补码转化规则
- 原码:直接将数值按照正负数的形式翻译成二进制得到的就是原码
- 反码:对除符号位的位数按位取反得到
- 补码:反码+1
如下为1 与 -1 的原码、反码、补码
回归正题!在计算机的内存中,对于整数而言 储存的是整数的补码 !这是为什么呢?原因如下:
- 使用补码,可以将符号位和数值域统一处理
- 同时,加法和减法也可以统一处理(CPU只有加法器)此外,补码与原码相互转换,其运算过程是相同的,不需要额外的硬件电路
下面我举个1 + -1的运算过程(X86架构下)
1的补码为: 00000000 00000000 00000000 00000001
-1的补码为: 11111111 11111111 11111111 11111111
我们让两者相加,我们会得到:1 00000000 00000000 00000000 00000000,因为处于32位系统下,得到的33位数的数据会舍弃一位,也就是1,所以我们得到的是 00000000 00000000 00000000 00000000 00000000 也就是0
三、大小端字节序
什么是大小端字节序?
在内存的数据存储中,超过一个字节的数据在内存中存储的时候,就有存储顺序的问题,按照不同的存储顺序,我们分为大端字节序存储和小端字节序存储
大端字节序存储
数据的低位字节内容保存在内存的高地址处,而数据的高位字节内容,保存在内存的低地址处
小端字节序
数据的地位字节保存在内存的低地址处,而数据的高位字节内容,保存在内存的高地址处
单靠文字是比较难理解的,下面我们举个例子:
#include <stdio.h>
int main() {
int i = 0x11223344;
return 0;
}
一、第一张图中,我们可以看出我们定义的数字 i 在内存中是倒着存储的
二、第二张图中,我们把每个字节的地址都显示了出来,我们知道一般地址大的为高位地址,如0x000000EF2C93F845 与 0x000000EF2C93F844相比,0x000000EF2C93F845是高位地址,对于数据如:0x11223344,字节高低是从左往右降低的,也就是11最高,44最低,所以我们可以看出这是一个大端存储方式
使用代码判断大小端存储
在计算机中我们同时可以使用代码判断计算机的存储方式:
假设我们定义一个1,1 的16进制为 0x00000001,而我们对其取地址可以获得它的第一个字节的地址,也就是高位地址,那么我们就可以通过判断这个高位地址的数值来判断大小端存储
#include <stdio.h>
int main() {
unsigned int x = 1;
char* ch = (char*)&x;
if (*ch == 1) {
printf("大端\n");
}
else {
printf("小端\n");
}
return 0;
}
四、浮点数在内存中的存储
浮点数在内存中的存储与整数在内存中的存储大不相同,根据国际标准IEEE(电气和电子工程协会) 754,任意一个二进制浮点数V可以表示成下面的形式:
公式: V = (-1)s * M * 2E
- (−1)S 表示符号位,当S=0,V为正数;当S=1,V为负数
- M 表示有效数字,M是大于等于1,小于2的
- 2E 表示指数位
多说无益,下面我们举个例子:
对于浮点数 6.5来说,我们转化为二进制为:110.1,因为5的二进制为101,所以这里可能会有很多人误解为是110.101,那么为什么不是呢?下面我们就看一张图:
正是因为 0.5 等于 2-1 ,所以得到的转化结果为 1 ,所以才为 110.1 ,而不是 110.101。既然我们已经知道了 6.5 的二进制为 110.1 ,那么我们可以知道 S=1,M=1.101,E=2,那为什么E=2呢?有可能有些人也不太能理解,下面我做一下解释:
我们将十进制下的 1234 换成科学计数法为 1.234* 103 ,而对于110.1来说是处于2进制的,说以转化为科学计数法为: 1.101 * 23
在内存中浮点数储存的内存划分
我们知道有了上面的公式,那么我们就可以变化不同的S、M、E来存储不同的浮点数,其实在内存中S、M、E的值都有相应的内存位置,请看下面的图:
在内存中浮点数(S、E、M)按照这样的排布存储
浮点数存储的过程
- M的存储规定
因为1≤M<2 ,所以M可以写成1.xxxxxx 的形式,其中xxxxxx 表示小数部分,IEEE 754 规定,在计算机内部保存M时,默认这个数的第一位总是1,因此可以被舍去,只保存后面的xxxxxx部分。比如保存1.01的时候只保存01,等到读取的时候,再把第一位的1加上去,这样可以节省1位有效数字。以32位浮点数为例:留给M只有23位,将第一位的1舍去以后,等于可以保存24位有效数字。 - E的存储规定
E时一个无符号位(unsigned int)的整数,如果E为 8 位,它的取值范围为 0 - 255 ;如果E为 11 位,它的取值范围 0 - 2047 。但是,我们知道,科学计数法中的E是可以出现负数的,所以IEEE 754 规定,存入内存时E的真实值必须再加上一个中间数,对于 8 位的E,这个中间数是 127 ;对于 11 位的E,这个中间数是 1023 。比如,210的E是10,所以保存成32位浮点数时,必须保存成10+127=137,即10001001
浮点数取得过程
浮点数取得过程也是比较复杂得,分三种情况:E不全为0也不全为1、E全为0、E全为1
- E不全为0也不全为1
这时,浮点数就采用下面的规则表示,即指数E的计算值减去127(或1023),得到真实值,再将有效
数字M前加上第一位的1
我们举个例子
0 01111110 00000000000000000000000
这是0.5的二进制表示,及(-1)0 * 2 -1 S = 0,E = -1,M = 1,01111110 转化为10进制为126,那么126 - 127 = -1,也就是1.0 * 2-1 = 0.5
- E全为0
这时,浮点数的指数E等于1-127(或者1-1023)即为真实值,有效数字M不再加上第一位的1,而是还
原为0.xxxxxx的小数。这样做是为了表示±0,以及接近于0的很小的数字,E全为0相当于,1.xxxxxx * 2-127,这是一个极小的值
0 00000000 00000000000000000000000
E全为0的情况是很少见的
- E全为1
这时,如果有效数字M全为0,表示±无穷大(正负取决于符号位s),相当于二进制表示一个1.xxxxx * 2^127的数值,是极大的值
0 111111111 00000000000000000000000
End
对于数据在内存中的存储,本篇文章就讲到这里了,如若有不详细之处,还望大家多多海涵,谢谢大家的阅读!