一、什么是字节对齐,为什么要对齐?
现代计算机中内存空间都是按照byte划分的,从理论上讲似乎对任何类型变的访问可以从任何地址开始,但实际情况是在访问特定类型变量的时候经常在特定的内存地址访问,这就需要各种类型数据按照一定的规则在空间上排列,而不是顺序的一个接一个的排放,这就是对齐。 对齐的作用和原因:各个硬件平台对存储空间的处理上有很大的不同。一些平台对某些特定类型的数据只能从某些特定地址开始存取。比如有些架构的CPU在访问一个没有进行对齐的变量的时候会发生错误,那么在这种架构下编程必须保证字节对齐.其他平台可能没有这种情况,但是最常见的是如果不按照适合其平台要求对数据存放进行对齐,会在存取效率上带来损失。比如有些平台每次读都是从偶地址开始,如果一个int型(假设为32位系统)如果存放在偶地址开始的地方,那么一个读周期就可以读出这32bit,而如果存放在奇地址开始的地方,就需要2个读周期,并对两次读出的结果的高低字节进行拼凑才能得到该32bit数据。显然在读取效率上下降很多。
二、分析如下代码,谈谈对齐
/*测试代码 1-1*/
#include <stdio.h>
struct Student
{
int num; //4
char name[20]; //20
char sex; //1
int age; //4
float score; //4
char addr[30]; //30
}stu1;
int main()
{
int len;
len = sizeof(stu1);
printf("%d", len); //len = 68 68 % 4 = 0
return 0;
}
此代码,按照通常人的理解, len = 4 + 20 + 1 + 4 + 4 + 30 = 63 。但是事实上,这里的len 为68。这里就是因为struct 的对齐导致。理论就是上面的(一)这里就不说了。
重点:因为要struct 对齐,所以上面是68。 struct 的对齐方式,以及对齐的大小都是有规定的。struct 的最后大小必须是struct 中成员最大类型的整数倍,比如有 int , float 的,必须能被4 整除,有double 的,则必须能被8 整除。但是他的计算过程又是怎样的呢?下面我们看看如下代码,分析他们的struct 大小为什么不一样?
/*测试代码 1-2*/
#include <stdio.h>
typedef struct
{
char a; //1
double b; //8
int c; //4
}obj1;
typedef struct
{
char a; //1
int c; //4
double b; //8
}obj2;
int main()
{
int len1, len2;
len1 = sizeof(obj1); // len1 = 24
len2 = sizeof(obj2); // len2 = 16
printf("%d\n%d\n", len1, len2);
return 0;
}
从上面的代码可以看出,两个struct 的内部成员都是一样的,一个char, 一个double, 一个int。那么为什么他们的最后大小结果不一样呢?这里就是因为IDE 规定各成员变量存放的起始地址相对于结构的起始地址的偏移量必须为该变量的类型所占用的字节数的倍数。
对齐方式(变量存放的起始地址相对于结构的起始地址的偏移量)
Char 偏移量必须为sizeof(char)即1的倍数
Short 偏移量必须为sizeof(short)即2的倍数
int 偏移量必须为sizeof(int)即4的倍数
float 偏移量必须为sizeof(float)即4的倍数
double 偏移量必须为sizeof(double)即8的倍数
各成员变量在存放的时候根据在结构中出现的顺序依次申请空间,同时按照上面的对齐方式调整位置,空缺的字节IDE 会自动填充。同时IDE 为了确保结构的大小为结构的字节边界数(即该结构中占用最大空间的类型所占用的字节数)的倍数,所以在为最后一个成员变量申请空间后,还会根据需要自动填充空缺的字节。
那么现在我们来分析一下上面这个代码1-2 。
首先obj1 这个结构体。先为第一个成员char a 分配空间,他的起始偏移量为0,是1 的整数倍,所以直接分配1 个空间。接着为第二个成员double b 分配空间,他的起始偏移量现在为1(char a 占据了1 个字节空间),他不是8 的倍数,所以要在当前偏移量的后面填充空字节,使得偏移量是8 的倍数,这里填上7 个空字节。所以偏移量为8,然后再加上double b 的8个字节。接着为 int c 分配空间,他的起始偏移量为 1(char a 的长度) + 7(空字节)+ 8(double b 的长度) = 16,所以当前偏移量是4 的整数倍,故而直接将int c 需要的4 个字节添加在后面就OK。然后得到的总长度是 1 + 7 + 8 + 4 = 20,这里我们又要考虑一个问题,struct 的总长度必须是结构体成员中数据类型中最大长度的整数倍,这里最大为double 8 个字节,所以得到整个struct 的最后长度为 24(大于20 的8 的最小倍数)。
接着我们分析obj2 这个结构体,方法完全相同,char a 分配1 个字节。接着为 int c 分配,先添加3 个空字节,然后构成偏移量是4 的整数倍,接着为double b 分配空间,偏移量是8 是8 的整数倍,所以直接分配空间。所以得到的大小为:1 + 3 + 4 + 8 = 16。 因为16 是最大类型double 的整数倍,故而obj2 的struct 长度大小为16.
所以,别看struct 内部成员变量数量相同,类型相同,但是长度结果却不一样,因这还跟他们的排列顺序有关。
同理测试代码1-1 的分析也是如此:
首先int num 起始偏移量为0,分配4 个字节空间。接着为char name[20]分配空,考虑到char 类型长度为1, 他的偏移量为4,是他的整数倍,故而直接分配20 个字节空间。再为char sex 分配空间,同理分配1 个字节空间。那么当前偏移量为 4 + 20 + 1 = 25.接着为int age 分配空间,因为偏移量是25 不是4 的整数倍,故而填3 个空字节,使得偏移量为28, 成为4 的整数倍,然后为int age 分配空间。偏移量为28 + 4 = 32 是float 类型4 的整数倍,故而直接分配空间。偏移量变为 32 + 4 = 36.在为char addr[30] 分配空间。得到struct 的长度为 66. 最后考虑struct 的长度必须是整个成员变量中,最长类型的整数倍,这里最长为int 和float 的4 个字节。所以struct 的长度必须是4 的整数倍,故而最终struct 的长度为 68.
typedef struct node
{
struct node *next;
}node;
这里求出的sizeof(node) = 4; 从这里我们知道结构体的指针大小也为 4 个字节(struct node *next 4 个字节)。
到这里,我们基本能搞明白struct 的对齐原理,以及计算方式。总结为两个步骤:
1、逐个按顺序分配空间,偏移量必须是当前变量类型的整数倍,如果不是填空字节补充。
2、得到的最后长度,必须是struct 成员变量中字节最长类型的整数倍。