内存对齐
- 第一个成员在与结构体变量偏移量为0的地址处。
- 其他成员变量要对齐到某个数字(对齐数)的整数倍的地址处。对齐数=编译器默认的一个对齐数与该成员大小的较小值。 VS中默认的值为8,Linux中的默认值为4
- 结构体总大小为最大对齐数(每个成员变量都有一个对齐数)的整数倍。
- 如果嵌套了结构体的情况,嵌套的结构体对齐到自己的最大对齐数的整数倍处,结构体的整体大小就是所有最大对齐数(含嵌套结构体的对齐数)的整数倍。
内存对齐的意义
- 平台原因(移植原因):不是所有的硬件平台都能访问任意地址上的任意数据的;某些硬件平台只能在某些地址处取某些特定类型的数据,否则抛出硬件异常。
- 性能原因:数据结构(尤其是栈)应该尽可能地在自然边界上对齐。为了访问未对齐的内存,处理器需要作两次内存访问;而对齐的内存访问仅需要一次访问。
- 结构体的内存对齐是拿空间来换取时间的做法。
修改默认对齐数
#pragma pack(8)//设置默认对齐数为8
#pragma pack()//取消设置的默认对齐数,还原为默认对齐数
计算偏移量
有两种方法:
struct S {
int a;
char b;
double c;
} s;
printf("%d\n", ((char*)&s.b - (char*)&s));
- 利用宏定义实现
#define FIND(type, var) ((size_t)&(((type*)0)->var))
这样不需要实例化对象也可以
位段
- 位段的成员可以是int,unsigned int,signed int或者是char(属于整形家族)类型
- 位段的空间上是按照需要以4个字节(int)或者1个字节(char)的方式来开辟的
- 位段涉及很多不确定因素,位段是不跨平台的,注重可移植的程序应该避免使用位段
位段的跨平台问题
- int位段被当成有符号数还是无符号数是不确定的。
- 位段中最大位的数目不能确定。(16位机器最大16,32位机器最大32)
- 位段中的成员在内存中从左向右分配,还是从右向左分配标准尚未定义。
- 当一个结构包含两个位段,第二个位段成员比较大,无法容纳于第一个位段剩余的位时,是舍弃剩余的位还是利用,这是不确定的。
跟结构相比,位段可以达到同样的效果,但是可以很好的节省空间,但是有跨平台的问题存在。
柔性数组
C99中,结构中的最后一个元素允许是未知大小的数组,这就叫做柔性数组成员。
typedef struct st_type {
int i;
int a[0];//柔性数组成员,有些编译器会报错无法编译可以改成:int a[];
} type_a;
柔性数组的特点
结构中的柔性数组成员前面必须至少一个其他成员。
sizeof返回的这种结构大小不包括柔性数组的内存。
包含柔性数组成员的结构用malloc()函数进行内存的动态分配,并且分配的内存应该大于结构的大小,以适应柔性数组的预期大小。
枚举
枚举的优点:
- 增加代码的可读性和可维护性
- 和#define定义的标识符比较枚举有类型检查,更加严谨。
- 防止了命名污染(封装)
- 便于调试
- 使用方便,一次可以定义多个常量。
- #define宏常量是在预编译阶段进行简单替换。枚举常量则是在编译的时候确定其值。
enum Color {
RED,
GREEN,
BLUE
};
enum Color clr = GREEN; // 只能拿枚举常量给枚举变量赋值,才不会出现类型的差异。
clr = 1; // 在C语言中可以这样赋值,因为C语言中枚举和整型是一种类型,而C++中枚举是一个单独的类型所以会报错
联合(共用体)
在union中所有的数据成员共用一个空间,所有的数据成员具有相同的起始地址
在C++中,union成员默认属性页为public。union 主要用来压缩空间。如果一些数据
不可能在同一时间同时被用到,则可以使用 union。
联合的大小至少是最大成员的大小。当最大成员大小不是最大对齐数的整数倍的时候,就要对齐到最大对齐数的整数倍。
一个有趣的问题
typedef struct str {
int len;
char s[7];
} str;
int main() {
str* f = NULL;
if (f->s) { // 这里会出错吗?
printf("%d\n", sizeof(f->s));
}
return 0;
}
这样完全没有问题,并且输出结果为7;
用空指针访问成员变量为什么不会出错?
我们可以测试下这个代码
printf("%d\n", f->s);
// 输出为4
其实,所谓变量,其实是内存地址的一个抽像名字罢了。在静态编译的程序中,所有的变量名都会在编译时被转成内存地址。机器是不知道我们取的名字的,只知道地址。
所以有了——栈内存区,堆内存区,静态内存区,常量内存区,我们代码中的所有变量都会被编译器预先放到这些内存区中。
不管结构体的实例是什么------访问其成员其实就是加成员的偏移量
由于f为NULL,所以f->s就是给NULL加上偏移量4,并没有发生读取内存操作,但是如果这样:
printf("%d\n", f->s[1]);
// 读取非法内存,会崩掉
printf("%d", f->len);
// 读取非法内存,会崩掉
printf("%d", &(f->len));
// 没有读取内存,不会崩掉