struct union数据对齐

本文详细解析了数据对齐的概念,包括基本数据类型、结构体(struct)、联合体(union)的对齐规则,以及如何通过预处理器指令调整对齐值。通过具体代码示例,展示了不同情况下数据成员的对齐方式及其对结构体和联合体大小的影响。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

数据对齐几年前看过,都忘了,看深入理解计算机系统又看到了,今天回顾下做下记录
参考文章
struct union数据对齐和sizeof大小
这篇文章只说明struct结构体和union联合体的对齐

1 基本数据类型的数据对齐
基本类型的数据对齐值是其本身的大小。

2 struct/class的自身对齐值。对于结构体和类的自身对齐值是所有成员中最大的自身对齐值。
结构体和类的对齐规则:先将数据成员对齐,在将结构体和类自身对齐,最终大小与数据成员顺序 有关。

这里的数据对齐是指数据的地址是对齐

3 union的自身对齐值。union的自身对齐值是所有成员中最大的对齐值。union的对齐规则,只需要union自身对齐,不需要数据成员对齐,最终大小与数据成员顺序无关。

4 指定对齐值。使用#pragma pack(n)指定对齐值为n,使用#pragma pack() 回复默认对齐值。

5 有效对齐值。对于指定了对齐值的代码, 有效对齐值=min(类/结构体/成员的自身对齐值, 指定对齐值)
未指定对齐值时,默认的对齐值一般为4。
有效对齐值决定了数据存放的方式,sizeof运算符是根据有效对齐值计算大小的。

struct结构体的数据对齐

上测试代码:

#include <stdio.h>
#include <stdlib.h>

struct A
{
	char a[7];
	short b;
	int c;
};

struct B
{
	short a;
	int b;
	char c[9];

};

struct C
{
	int a;
	char b[7];
	short c;
};

void main()
{

	printf("A:%d\n", sizeof(A));
	printf("B:%d\n", sizeof(B));
	printf("C:%d\n", sizeof(C));
	A a;
	printf("a:%0x,a.a:%0x,a.b:%0x,a.c:%0x\n", &a, &a.a, &a.b, &a.c);
	B b;
	printf("b:%0x,b.a:%0x,b.b:%0x,b.c:%0x\n", &b, &b.a, &b.b, &b.c);
	C c;
	printf("c:%0x,c.a:%0x,c.b:%0x,c.c:%0x\n", &c, &c.a, &c.b, &c.c);
	
	system("pause");
}

结果:
在这里插入图片描述

A
A的大小如果不考虑数据对齐的话为13,假设a变量起始位0X00,a.a是第一个变量,所以a.a的地址位0X00,a.a的地址对齐值是1,共分配7个字节;a.b的地址对齐值是2 ,所以a.b起始地址必须满足被2整除,所以a.b的地址是0X08((7+1)%2=0),分配2个字节;a.c的地址对齐值是4,前面占用10个字节了,所以地址是0X0C((10+2)%4=0),分配4个字节,当前A的大小是16个字节,A的对齐值是4,16%4=0,所以A的大小是16字节
B
假设b变量起始位0X00,b.a是第一个变量,所以b.a的地址位0X00,b.a的地址对齐值是2,分配2个字节;b.b的地址对齐值是4 ,所以b.b起始地址必须满足被4整除,所以b.b的地址是0X04((2+2)%4=0),分配4个字节;b.c的地址对齐值是1个字节,前面占用8个字节了,所以地址是0X08((8+0)%1=0),分配9字节,当前B的大小是17个字节,B的对齐值是4,(17+3)%4=0,所以B的大小是20字节
C
假设c变量起始位0X00,c.a是第一个变量,所以b.a的地址位0X00,c.a的地址对齐值是4,分配4个字节;c.b的地址对齐值是1 ,所以c.b起始地址必须满足被1整除,所以c.b的地址是0X04((4+0)%4=0),分配7个字节;c.c的地址对齐值是2,前面占用11个字节了,所以地址是0X0C((11+1)%2=0),分配2字节,当前B的大小是14个字节,B的对齐值是4,(14+2)%4=0,所以B的大小是16字节

A,B,C结构体的数据对齐值是所有基础变量的最大值,这里是int,对齐值4,
根据打印结果验证通过

union联合体数据对齐

上测试代码:

#include <stdio.h>
#include <stdlib.h>

union A
{
	char a[7];
	short b;
	int c;
};

union B
{
	short a;
	long long b;
	char c[9];

};


void main()
{

	printf("A:%d\n", sizeof(A));
	printf("B:%d\n", sizeof(B));
	printf("long long size:%d\n", sizeof(long long));
	A a;
	printf("a:%0x,a.a:%0x,a.b:%0x,a.c:%0x\n", &a, &a.a, &a.b, &a.c);
	B b;
	printf("b:%0x,b.a:%0x,b.b:%0x,b.c:%0x\n", &b, &b.a, &b.b, &b.c);
	system("pause");
}

结果:
在这里插入图片描述
A
A 三个变量占用字节最大的值是a,7个字节,A的对齐值是4,所以A的大小是7+1=8((7+1)%4=0)
B
B 三个变量占用字节最大的值是c,9个字节,B的对齐值是8,所以B的大小是9+7=16 ((9+7)%8=0)

结构体和联合体嵌套混合也是这么分析,这里不再做说明了

<think>好的,用户现在问的是关于C语言中的structunion,需要我用中文回答。先回顾之前的对话历史,用户之前询问了如何用表达式二叉树在C语言中实现自动微分,我给出了详细的代码示例和解释。现在用户可能想更深入了解C语言的结构体和联合体的概念,因为在上次的回答中,我用到了structunion来构建节点类型。 首先,我需要明确用户的需求。他们可能是在学习C语言的数据结构,或者在实际编程中遇到了structunion的使用问题。用户可能对两者的区别、内存分配方式以及适用场景不太清楚。需要详细解释structunion的基本概念,内存布局,以及各自的优缺点,同时结合示例代码帮助理解。 接下来要考虑用户可能的背景。用户可能已经有一定的C语言基础,但对复合数据类型的使用还不够熟悉。需要以简明清晰的方式解释,避免过于复杂的术语,同时提供实际的例子。例如,在之前的自动微分例子中,struct Node使用了union来存储不同类型的值,这可以作为一个实际案例来说明union的节省内存的作用。 然后,我需要组织回答的结构。先介绍struct,包括定义、内存分配、访问方式、使用场景;再介绍union,同样包括定义、内存特性、访问方式和使用场景。之后比较两者的区别,强调内存占用和成员存储方式的不同。最后给出实际应用的例子,比如协议解析、类型多态等,帮助用户更好地理解如何在实际项目中应用这两种结构。 还要注意用户可能的误区,比如误用union导致数据覆盖,或者不理解结构体内存对齐的问题。需要指出这些注意事项,帮助用户避免常见错误。例如,在union中同时存储多个成员可能导致数据被覆盖,需要根据实际情况谨慎使用。 最后,确保回答符合之前的系统级指令,使用正确的Markdown格式,行内公式用$...$,独立公式用$$...$$,并且结构清晰,分步骤说明。同时检查LaTeX语法是否正确,比如结构体内存计算的部分可能需要用公式表示,但根据用户的问题,可能不需要太多数学公式,重点在代码和文字解释。 总结回答要点:定义、内存布局、访问方式、区别对比、使用场景、注意事项、示例代码。确保每个部分都有清晰的标题和内容,帮助用户逐步理解structunion的核心概念和应用方法。</think>以下是关于C语言中`struct`(结构体)和`union`(联合体)的详细对比说明: --- ### 一、结构体(struct) #### 1. 定义与特性 - **数据组合**:将多个不同类型的变量组合成单一逻辑单元 - **内存分配**:所有成员独立占用内存(内存总和 = 各成员内存之和 + 对齐填充) - **访问方式**:成员同时存在,互不影响 #### 2. 语法示例 ```c struct Student { int id; // 4字节 char name[20]; // 20字节 float score; // 4字节 }; // 总内存 ≥ 28字节(考虑内存对齐) ``` #### 3. 内存布局示意图 ``` 0 4 24 28 |-----|----------|-------| id name score ``` #### 4. 使用场景 - 表示实体对象(如学生、坐标点) - 需要同时访问多个关联数据 - 数据持久化存储 --- ### 二、联合体(union) #### 1. 定义与特性 - **内存复用**:所有成员共享同一块内存空间 - **内存分配**:总内存 = 最大成员所需内存 - **访问方式**:同一时刻只能使用一个成员 #### 2. 语法示例 ```c union Data { int i; // 4字节 float f; // 4字节 char str[8]; // 8字节 }; // 总内存 = 8字节 ``` #### 3. 内存布局示意图 ``` 0 8 |------------| i/f/str共享区域 ``` #### 4. 使用场景 - 节省内存(如嵌入式系统) - 类型多态(同一数据多种解释方式) - 协议解析(网络数据包的不同字段解析) --- ### 三、核心区别对比 | 特性 | struct | union | |--------------------|-----------------------------|----------------------------| | 内存占用 | 成员内存总和 + 填充 | 等于最大成员内存 | | 数据存储 | 所有成员独立存储 | 共享存储空间 | | 同时访问 | 支持 | 每次只能访问一个成员 | | 典型用途 | 数据聚合 | 类型转换/内存复用 | --- ### 四、复合使用实例 ```c // 用于存储不同数据类型的值 typedef struct { enum {INT, FLOAT, STRING} type; union { int i; float f; char s[20]; } value; } Variant; // 使用示例 Variant v; v.type = FLOAT; v.value.f = 3.14; // 此时i和s的值不可预测 ``` --- ### 五、关键注意事项 1. **结构体内存对齐**: ```c struct Example { char c; // 1字节(实际占4字节) int i; // 4字节 }; // 总大小 = 8字节(非5字节) ``` *对齐规则*:成员地址必须是其类型大小的整数倍 2. **联合体数据覆盖**: ```c union Data u; u.i = 10; // 写入整型 u.f = 3.14; // 覆盖原有数据 ``` **后果**:`u.i`的值将变为浮点数的二进制表示 3. **位域联合应用**(硬件寄存器映射): ```c union Register { uint32_t value; struct { uint32_t enable : 1; uint32_t mode : 3; uint32_t status : 4; } bits; }; ``` --- ### 六、典型应用场景 1. **struct**: - 文件格式解析(BMP头、TCP首部) - 面向对象编程模拟(封装数据与方法) - 树/链表节点定义 2. **union**: - 协议解析(如IP地址转换): ```c union IPAddress { uint32_t binary; uint8_t octet[4]; }; ``` - 类型转换(浮点数的二进制分析): ```c union FloatConverter { float f; unsigned int u; }; ``` - 内存敏感场景(嵌入式系统状态记录) --- 通过合理使用`struct`和`union`,可以实现:✅ 数据高效组织 ✅ 内存优化 ✅ 类型灵活转换。理解二者的内存分配机制是正确使用的关键。
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值