深度剖析数据在内存中的存储

本文深入讲解了数据在计算机中的存储方式,包括不同类型数据的存储形式、整型的原码、反码、补码概念及补码的重要性,浮点数遵循的IEEE 754标准,以及大小端的区别。

重点内容

前言

数据,是编程语言的组成元素,也是我们编码所要处理的目标,程序运行的过程中就是在不断地创建、运算、处理各种各样的数据。本篇博客将深入的介绍各种数据类型以及他们在计算机中的存储


一、数据类型的详细介绍

数据类型介绍

c语言中基本的内置类型有以下几种:

char //字符数据类型
short //短整型
int //整型
long //长整型
long long //更长的整型
float //单精度浮点型
double //双精度浮点型

注意:c语言没有字符串类型
各种类型在不同操作系统下所占用的内存空间不同,如long型在32位操作系统和64位操作系统下占用内存分别为4字节和8字节。

类型的基本归类

整数类型:

char、short、int、long

浮点数类型:

float、double

构造类型:

数组类型
结构体类型 struct
枚举类型 enum
联合体类型 union

指针类型:

int *pi;
char *pc
float *pf
void *pv

空类型:

void 表示空类型(无类型)
通常用于函数的返回类型、函数的参数、指针类型。

二、整型在内存中的存储

一个变量的创建是要在内存中开辟空间的,空间大小是根据不同的类型以及不同的操作系统决定的。那么数据在开辟的内存中是如何存储的呢?
比如:
int a=20;
int b=-10;
我们知道计算机为a分配了四个字节的空间,那这四个字节每个比特位都是如何存储的?
先了解下面的概念:

原码、反码、补码

计算机中的有符号数有三种表示方法,即原码、补码、反码。
三种表示方法都有符号位和数值位两部分,符号位都是用0表示正,用1表示负,而数值位三种表示方法各不相同。

原码
直接将二进制按照正负数的形式翻译成二进制就行
反码
将原码符号位不变,其他位依次按位取反得到反码
补码
反码+1就得到补码

正数的原码反码补码都相同。
对于整形来说:数据存放内存中其实存放的是补码

为什么?

在计算机系统中,数值一律用补码来表示和存储。原因在于,使用补码,可以将符号位和数值域统一处理;同时,加法和减法也可以统一处理(CPU只有加法器),此外,补码与源码相互转换,其运算过程是相同的,不需要额外的硬件电路。

看一下内存中两个变量的存储:
在这里插入图片描述
可以看到对于a和b都存储的是补码,但是顺序并不是所预想的 00 00 00 14
为什么呢?这就牵扯到另一个知识点了:大小端

大小端介绍

什么是大端小端:

大端存储模式,是指数据的低位保存在内存的高地址中,而数据的高位,保存在内存的低地址中;
小端存储模式,是指数据的低位保存在内存的低地址中,而数据的高位,保存在内存的高地址中;

为什么有大端和小端:

因为在计算机系统中,我们是以字节为单位的,每个地址单元都对应着一个字节,一个字节为8bit。
但是在C语言中除了8bit的char之外,还有16bit的short型,32bit的int型。另外,对于位数大于8位的处理器,例如16位或者32位的处理器,由于寄存器宽度大于一个字节,那么必然存在着一个如果将多个字节安排的问题。因此就导致了大端存储模式和小端存储模式。

例如一个16bit的short型x,在内存中的地址为0x0010,x的值为0x1122,那么0x11为高字节,0x22为低字节。
对于大端模式,就将0x11放在低地址中,即0x0010中,0x22放在高地址中,即0x0011中。小端模式,刚好相反。

字节序

在这里再插入一个知识点 字节序:是指CPU对内存中的数据以字节为单位进行存取的顺序,内存是有高低地址之分的,而每个数据的二进制又有高低位之分。

主机的字节序取决于cpu的架构:X86–小端 MIPS–大端
例如 int a=1;小端中存储的是 00 00 00 01 ,大端则是 01 00 00 00

字节序针对的数据:针对存储单元大于一个字节的数据类型:short、int、long、float、double;而char a[10]这种字符数组是不受影响的。

如何判断当前主机的字节序(大小端)呢?

# include <stdio.h>
int main()
{
    int a=1;
    char *p=&a;
    if(*p==1)
    printf("当前机器是小端");
    else
    printf("当前机器是大端");
    return;
}

在上面这个程序中,因为a变量占用了四个字节,大端中a变量:0x 00 00 00 01 小端中a变量:0x 01 00 00 00
而*p是char类型 只占用一个字节,将a变量首地址(低地址)处一个字节内的数据赋给p,如果是1就是小端 如果是0就是大端。

浮点数的存储

根据国际标准IEEE(电气和电子工程协会) 754,任意一个二进制浮点数V可以表示成下面的形式:

*(-1)^S * M * 2 ^E
*(-1)^S表示符号位,当s=0,V为正数,当s=1,V为负数。
*M表示有效数字,大于等于1,小于2。
*2^E表示指数位

举例来说:十进制的5.0,写成二进制是101.0,相当于1.01×2^2。那么,按照上面的标准,可以得出s=0,M=1.01,E=2。 btw,小数的存储采用二进制用乘二取整法。

IEEE 754规定:对于32位的浮点数,最高的1位是符号位 接着的8位是指数E,剩下的23位是有效数字M。
在这里插入图片描述
对于64位的浮点数,最高1位是符号位,接着的11位是指数E,剩下的52位为有效数字M。
在这里插入图片描述
存储规则:

因为指数位的数值有时候可能是负数,但是指数域是无符号的,无法表示负数,所以采用指数基数:127,真正指数位存储的数据是实际指数值+127。专业的说法叫做使用数字的移码-1; 移码:正数的移码就是符号位取反
因为浮点存储在进行浮点移动的时候,总会移动到第一个1的后边,因此所有的数字表示都是1.xxxxxxx
采用这种方式之后,因为尾数部分,第一个比特位总是存储1,如果把这个1忽略掉,采用这种规则,用的时候再加上,这个1就不用存储了,可以节省一个比特位。

举个栗子:
在这里插入图片描述

再举两个栗子:
-3.125 —>-11.001
S:1
E:1+127=128
M:1.1001
所以存储是:
1 10000000 10010000 00000000 0000000 即 11000000 01001000 00000000 00000000 —>c0 48 00 00


0.125—>0.001
S: 0
E: -3+127=124
M: 1
0 01111100 00000000 00000000 0000000 即00111110 00000000 00000000 00000000 —>3e 00 00 00

两种特殊情况:

E为全0:这时真实指数值是1-127=-126,M表示真实值,通常表示正负0
E为全1:这时候真实指数值是255-127=128,M为全0,表示正负无穷大。

上边是32位的存储,对于64位存储思想是一样的,只是各个区域的比特位数不同。64位下指数位E占12个比特位,指数基数为1023。

总结

以上就是今天要讲的内容,本文介绍了数据在内存中的存储方式以及存储规则,个人认为比较重要的就是大小端的部分以及浮点数的存储。
希望看到的老铁们多多支持,纯手敲了一下午(´•ω•̥`)。

评论 6
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

彭彭彭摆鱼

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值