目录
一、数据类型的介绍
目前我们接触的有以下7钟数据类型:
- char //字符数据类型
- shor //短整型
- int //整形
- long //长整型
- long long //更长整形
- float //单精度浮点数
- double //双精度浮点数
我们都知道在C语言中,用0表示假,用非0表示真。
int main()
{
int flag=0;
if(flag)
{
//!flag;表示假
}
return 0;
}
而C99中引入了布尔类型
_Bool 变量名=ture或者false;
介绍完这类数据类型,我们会想不同的数据类型有什么意义?
- 使用这个类型开辟内存空间的大小(大小决定了使用范围)。
- 如何看待内存空间的视角。
知道这些之后,我们来归类一下这些数据类型:
1.类型的归类
整形家族:
ps:因为字符的ASCII码值是个数字,所以也将char类型归类到整形家族。
unsigned无符号;signed有符号(一般编译器自动帮我们加上,因此可以省略不写)。
char有无符号取决于编译器,一般时signed(有符号).
对于有无符号我们可以举个例子来了解:
至于第二个b为什么会输出一个这么大的数,我们往下会讲。
浮点数家族 :
构造类型:
空类型:
void 表示空类型(无类型) 通常应用于函数的返回类型、函数的参数、指针类型。
二、整形在内存中的存储
我们知道创建一个变量是要在内存中开辟空间的,开辟空间大小由类型决定。
比如:
int a=10; //a分配了4个字节
char b=10;//b分配了1个字节
ps:想知道类型大小可以用sizeof()函数计算。
2.1原码,反码,补码
之前整形提升我们有了解到计算机中的整数有三种2进制表示方法,即原码、反码和补码,整数的原码,反码,补码都一样,而负数的都不相同。
负数三种码的表示:
原码:直接将数值按照正负数的形式翻译成二进制就可以得到原码。
反码:符号位不变,其他位按位取反。
补码:反码+1就得到补码。
ps:对于整形来说内存中存储的其实是补码。
为什么呢?
在计算机系统中,数值一律用补码来表示和存储。原因在于,使用补码,可以将符号位和数值域统 一处理; 同时,加法和减法也可以统一处理(CPU只有加法器)此外,补码与原码相互转换,其运算过程 是相同的,不需要额外的硬件电路。
举例:
用计算机计算1-1,但是计算机只有加法器,因此通过处理1-1变为1+(-1):
接着我们回到上面b为什么这么大的问题上:
b=-10;现在我们知道-10在内存中是补码存储形式存储的。
要将这个数字转换成无符号数输出,则会直接输出补码的二进制序列,我们将这个数字放在计算器中转换为时间结果如下:
我们来看看刚刚的a和b在内存中的存储:
我们可以看到对于a和b分别存储的是补码。但是我们发现顺序有点不对劲。这又是为什么呢?
要解释这个问题就要引进两个新的概念大端存储和小端存储。
三、大小端介绍
大端(存储)模式:是指数据的低位保存在内存的高地址中,而数据的高位,保存在内存的低地址 中;
小端(存储)模式,是指数据的低位保存在内存的低地址中,而数据的高位,,保存在内存的高地 址中。
举例:
1在内存中如下:
当存储方式是以下:
小端:
大端:
了解完大小端,我们就可以发现我们上面的存储模式是小端存储。但问题又来了,为什么有大小端呢?
为什么会有大小端模式之分呢?这是因为在计算机系统中,我们是以字节为单位的,每个地址单元 都对应着一个字节,一个字节为8 bit。但是在C语言中除了8 bit的char之外,还有16 bit的short 型,32 bit的long型(要看具体的编译器),另外,对于位数大于8位的处理器,例如16位或者32 位的处理器,由于寄存器宽度大于一个字节,那么必然存在着一个如何将多个字节安排的问题。因 此就导致了大端存储模式和小端存储模式。
例如:一个 16bit 的 short 型 x ,在内存中的地址为 0x0010 , x 的值为 0x1122 ,那么 0x11 为 高字节, 0x22 为低字节。对于大端模式,就将 0x11 放在低地址中,即 0x0010 中, 0x22 放在高 地址中,即 0x0011 中。小端模式,刚好相反。我们常用的 X86 结构是小端模式,而 KEIL C51 则 为大端模式。很多的ARM,DSP都为小端模式。有些ARM处理器还可以由硬件来选择是大端模式 还是小端模式。
四、浮点型在内存中的存储解析
4.1常见的浮点数:
3.14159
1E10
浮点数家族包括: float、double、long double 类型。
浮点数表示的范围:float.h中定义
%f或%lf默认小数点为6位
4.2浮点数存储规则
根据国际标准IEEE(电器和电子工程协会)754,任意一个二进制浮点数V可以表示成下面的形式:
(-1)^S*M*2^E
(-1)^S表示符号位,当s=0,V为正数;当s=1,v为负数。
M表示有效数字,大于等于1,小于2.
2^E表示指数位。
举个例子:
十进制的5.0,写成二进制是101.0,相当于1.01*2^2.
那么按照上面的讲法,此时s=0;M=1.01,E=2.
十进制的-9.0,写成二进制是-1001.0,相当于-1.001*2^3.
此时s=1;M=1.001,E=3.
IEEE 754规定:
对于32位浮点数,最高1位是符号位s,接着的8位是指数E,剩下的23位为有效数字M。
对于64为的浮点数,最高1位是符号位s,接着11位是指数E,剩下的52位是有效数字M。
IEEE 754对有效数字M和指数E,还有一些特别规定:
前面说过,1<=M<2,也就是说M可以写成1.XXXXXX的形式。所以IEEE 754规定,在计算机内部保存m时,默认这个数的第一位总是1,因此可以社区,只保存后面的XXXXXX部分。这样做的目的是节省1位有效数字。 以32位 浮点数为例,留给M只有23位, 将第一位的1舍去以后,等于可以保存24位有效数字。
至于指数E,情况就比较复杂。
首先,E为一个无符号整数(unsigned int) 这意味着,如果E为8位,它的取值范围为0~255;如果E为11位,它的取值范围为0~2047。但是,我们 知道,科学计数法中的E是可以出 现负数的,所以IEEE 754规定,存入内存时E的真实值必须再加上一个中间数,对于8位的E,这个中间数 是127;对于11位的E,这个中间 数是1023。比如,2^10的E是10,所以保存成32位浮点数时,必须保存成10+127=137,即 10001001。
然后,指数E从内存中取出还可以再分成三种情况:
E不全为0或不全为1
这时,浮点数就采用下面的规则表示,即指数E的计算值减去127(或1023),得到真实值,再将 有效数字M前加上第一位的1。 比如: 0.5(1/2)的二进制形式为0.1,由于规定正数部分必须为1,即将小数点右移1位,则为 1.0*2^(-1),其阶码为-1+127=126,表示为 01111110,而尾数1.0去掉整数部分为0,补齐0到23位00000000000000000000000,则其二进 制表示形式为:
E全为0
这时,浮点数的指数E等于1-127(或者1-1023)即为真实值, 有效数字M不再加上第一位的1,而是还原为0.xxxxxx的小数。这样做是为了表示±0,以及接近于 0的很小的数字。
E全为1
这时,如果有效数字M全为0,表示±无穷大(正负取决于符号位s);
举个例子:
int main()
{
int n = 9;
float* pFloat = (float*)&n;
printf("n的值为:%d\n", n);
printf("*pFloat的值为:%f\n", *pFloat);
*pFloat = 9.0;
printf("num的值为:%d\n", n);
printf("*pFloat的值为:%f\n", *pFloat);
return 0;
}
输出结果:
通过上述知识,我们可以很快得知为什么:
首先整形9在内存中储存为:
所以当从*pFloat中拿出时
又因为%f或%lf默认小数点为6位,所以此时输出为0.000000
转为十进制:
五、结论
通过本篇论文我们深度解析了数据在内存中时如何存储的,大家可以阅读加深理解。
最后如果大家觉得不错的话,麻烦点赞收藏+关注。