1.整数在内存中的存储
🌙对于整形来说,数据以补码的形式存放在内存中。
🌏原因:使⽤补码,可以将符号位 和数值域统⼀处理;同时,加法和减法也可以统⼀处理(CPU只有加法器),此外,补码与原码相互转换,其运算过程是相同的,不需要额外的硬件电路。
2.大小端字节序和字节序判断
⼤端(存储)模式:是指数据的低位字节内容,保存在内存的⾼地址处,⽽数据的⾼位字节内容,保存在内存的低地址处。
⼩端(存储)模式:是指数据的低位字节内容保存在内存的低地址处,⽽数据的⾼位字节内容,保存在内存的⾼地址处。
举例:
小端:
解释:我们可以从图中看到,0x11223344的低位字节序内容0x44存储到低地址0x0000005C8A8FFC04处,说明该字节顺序是小端。
练习1.设计⼀个⼩程序来判断当前机器的字节序
#include<stdio.h>
int check_sys()
{
int i = 1;
return (*(char*)&i);
}
int main()
{
int ret = check_sys();
if (ret == 1)
{
printf("小端\n");
}
else
{
printf("大端\n");
}
return 0;
}
check_sys函数用来判断机器的字节序。
*(char *)和 i 进行按位与计算。i 的16进制是0x00000001
如果机器是小端,则低位字节内容0x01存储到低地址中,则1和 * (char *)按位与是 1。
如果机器是大端,则高位字节内容0x00存储到低地址中,则0和 *(char *)按位与是 0。
练习2.有符号和无符号
#include<stdio.h>
int main()
{
char a = -1;
signed char b = -1;
unsigned char c = -1;
printf("%d %d %d",a,b,c);
return 0;
}
char类型比较有特殊,char是signed char 还是unsigned char 是不确定的,是取决于编译器的。
VS上的charsigned char,intsinged int。
❗注意:
char类型进行真值转换成补码形式时
第一个char a=-1转换如下:
原码1000 0000 0000 0000 0000 0000 0000 0001
反码1111 1111 1111 1111 1111 1111 1111 1110
补码1111 1111 1111 1111 1111 1111 1111 1111
char类型是8个比特位,进行截断:1111 1111
打印是整型,进行整型提升,求原码:此时是有符号类型,又是负数,则后面补1
补码1111 1111 1111 1111 1111 1111 1111 1111
反码1000 0000 0000 0000 0000 0000 0000 0000
原码1000 0000 0000 0000 0000 0000 0000 0001
所以打印出来-1
第二个signed char b=-1转换和第一个原理差不多,因为都是有符号转换。
第三个unsigned char c=-1转换如下:
原码1000 0000 0000 0000 0000 0000 0000 0001
反码1111 1111 1111 1111 1111 1111 1111 1110
补码1111 1111 1111 1111 1111 1111 1111 1111
char类型是8个比特位,进行截断:1111 1111
打印是整型,进行整型提升,求原码:此时是无符号类型,则不用看符号类型,则后面补0
补码0000 0000 0000 0000 0000 0000 1111 1111
反码0000 0000 0000 0000 0000 0000 1111 1111
原码0000 0000 0000 0000 0000 0000 1111 1111
所以打印出来255
练习3.
#include<stdio.h>
int main()
{
char a = -128;
printf("%u\n",a);//%u打印无符号的十进制整型
return 0;
}
// 原码 //1000 0000 0000 0000 0000 0000 1000 0000
// 反码 //1111 1111 1111 1111 1111 1111 0111 1111
// 补码 //1111 1111 1111 1111 1111 1111 1000 0000
有图可看到,十六进制DEC表示4294967168。
练习4.
#include<stdio.h>
int main()
{
char a[1000];
int i;
for (i = 0; i < 1000; i++)
{
a[i] = -1 - i;//-1 -2 -3 -1000
}
printf("%d",strlen(a));
return 0;
}
求字符串长度,统计的是\0之前出现的字符个数,\0的ASCII码值是0,其实找到0就行。
而循环中是将-1,-2,-3…-1000依次放入数组a[i]
我们再看有符号char 的取值范围:-128 ~ 127
则strlen从-1,-2…-128,127,126…3,2,1,0,遇到0停止,所以总共是128+127=255。
❗char取值范围是循环的。数组如遇到0时又从-1开始存放
练习5.
#include<stdio.h>
unsigned char i = 0;
int main()
{
for (i = 0; i <= 255; i++)
{
printf("Hello world\n");
}
return 0;
}
死循环
当i加到255时,继续加1时,i会变成0,则又开始循环。
练习6.
#include<stdio.h>
#include<windows.h>
int main()
{
unsigned int i;
for (i = 9; i >= 0; i--)
{
printf("%u\n",i);//%u打印无符号的十进制整型
Sleep(1000);
}
return 0;
}
unsigned说明 i 是恒大等于0。当 i 自减到 -1 时,机器是以补码形态存储,所以是1111 1111 1111 1111 1111 1111 1111 1111,是4294967295。
所以for循环会陷入死循环。
练习7.
#define _CRT_SECURE_NO_WARNINGS
#include<stdio.h>
int main()
{
int a[4] = { 1,2,3,4 };
int* ptr1 = (int*)(&a + 1);
int* ptr2 = (int*)((int)a + 1);
printf("%x,%x",ptr1[-1],*ptr2);
return 0;
}
ptr1[-1]相当于*(ptr1+(-1)),相当于 *(ptr1-1)
ptr1整型指针指向整个a数组后面,也就是4后面。
所以第一个打印出来的是ptr1指针往前移一位,所以指针指向了3后面,然后解引用,所以第一个打印是4。
ptr2整型指针是a数组强制类型转换成整型后+1的整型指针。
所以第二个打印出来的是ptr2解引用,如果程序是小端,则数据如图所示存放,低字节放在低地址。大端则反之。
❗值得注意的是:
要在x86环境下运行,因为x86环境下指针大小是4字节,a在强制类型转换成int整型时,不会发生截断,因为int整型大小也是4字节。
如果在x64环境下运行,就会发生非法访问,因为x64环境下指针大小是8字节,a在强制类型转换时会发生截断,造成后面程序非法访问。若强制类型转换的是long long,则是8字节转8字节,则不会发生截断。
3.浮点数在内存中的存储
浮点数家族:float、double、long double类型
常见浮点数:3.14159、1E10等
浮点数表示范围:float.h中定义
例如float的最大值和最小值范围如下所示
❗整型在内存中以补码形式存储,浮点型在内存中怎么存储呢?
首先,要了解浮点数在计算机内部的表⽰⽅法:
- 根据国际标准IEEE(电⽓和电⼦⼯程协会) 754,任意⼀个⼆进制浮点数V可以表⽰成下⾯的形式:
- V = (−1) ∗ S M ∗ 2E
- (−1)S 表⽰符号位,当S=0,V为正数;当S=1,V为负数
- M 表⽰有效数字,M是⼤于等于1,⼩于2的
- 2E表⽰指数位
举例
V=5.5(十进制表示)
=101.1(2进制表示)
=1.011*2^2 (用2的2次方表示是因为它是2进制)
=(-1)^0 * 1.011 * 2 ^2
所以S=0,M=1.011,E=2
所以存储浮点数只要把这三个数存储好就行了。
IEEE 754规定:
对于32位的浮点数,最高的1位 存储符号位S,接着的8位 存储指数E,最后的23位 存储有效数字M。
对于64位的浮点数,最高的1位 存储符号位S,接着着的11位 存储指数E,最后的52位 存储有效数字M。
🌏浮点数存的过程:
- S的存储:很容易存,因为正数就存0,负数就存1。
- M的存储:因为1<=M<2,所以M可以写成 1.xxxxxx的形式,其中xxxxxx表⽰⼩数部分。 IEEE754规定,在计算机内部保存M时,默认这个数的第⼀位总是1,因此可以被舍去,只保存后⾯的xxxxxx部分。⽐如保存1.01的时候,只保存01,等到读取的时候,再把第⼀位的1加上去。这样做的⽬的,是节省1位有效数字。以32位浮点数为例,留给M只有23位,将第⼀位的1舍去以后,等于可以保存24位有效数字。若保存有效数字后,后面存储还有空间,则剩下的补0。
- E的存储:存进内存里面的8位或者11位的E,都是无符号数,E都是无符号整数,但是有些时候E是负数,那就需要中间值,所以IEEE754规定,存⼊内存时E的真实值必须再加上⼀个中间数,对于8位的E,这个中间数是127;对于11位的E,这个中间数是1023。⽐如,2^10的E是10,所以保存成32位浮点数时,必须保存成10+127=137,即10001001。
我们用5.5来证明一下,上述说法:
#include<stdio.h>
int main()
{
float f= 5.5;
//(-1)^0 * 1.011 * 2 ^2
//S=0,E=2,M=1.011
//2进制存储64位 :0 100 0000 1 011 0000 0000 0000 0000 0000
//转换成16进制:0x40b00000
return 0;
}
所以存进去,要取出来就是取S,M,E,然后还原数据就行了。
🌙浮点数取的过程:
指数E从内存中取出还可以再分成三种情况:
- E不全为0或不全为1:指数E的计算值减去127(或1023),得到真实 值,再将有效数字M前加上第⼀位的1。
- E全为0:指数E等于1-127(或者1-1023)即为真实值,有效数字M不再加上第⼀位的1,⽽是还原为0.xxxxxx的⼩数。
- E全为1:这时,如果有效数字M全为0,表⽰±⽆穷⼤(正负取决于符号位s)。
练习8.
#define _CRT_SECURE_NO_WARNINGS
#include<stdio.h>
int main()
{
int n = 9;
float* pFloat = (float*)&n;//强制类型转换成float指针
printf("n的值为:%d\n",n);//9
printf("*pFlaot的值为:%f\n",*pFloat);
*pFloat = 9.0;//对n进行解引用并赋值
printf("num的值为:%d\n",n);
printf("*pFloat的值为:%f\n",*pFloat);
return 0;
}
解释:
第一个打印是9很好理解
第二个打印是0.000000,首先我们知道%f打印会自动保留小数点,9的2进制补码是0 00000000 000000000000000000001001,E全为0,所以真实值是1-127=-126,V=(-1) ^ 0 * 0.000000000000000000001001 *2^-126,所以打印0.000000
第三个打印是以浮点数形式存进去,以整数形式打印出来。 *pFloat存进去的浮点数以2进制形式V=1001.0=(-1)^0 * 1.001 * 2^3,所以S=0,M=1.001,E=3,2进制存储0 10000010 00100000000000000000000,
%d直接将这个2进制以10进制方式打印,得出1091567616。
第四个打印以浮点数形式存到9.0,最后以%f打印出来当然也是9.000000。