C语言结构体对齐

博客指出代码优劣影响软件质量与成本,强调区分核心域和非核心域的重要性。重点介绍C语言中字节对齐概念,阐述结构体对齐问题,通过示例展示不同结构体大小差异,还给出对齐准则,包括数据类型、结构体自身对齐值等,以及结构体字节对齐需满足的三个准则。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

前言

1)代码的优劣不仅直接决定了软件的质量,还将直接影响软件成本,软件成本由开发成本和维护成本组成的,而维护成本却远远搞于开发成本;

2)核心域和非核心域:要达到基于核心域的复用,有必要将核心域和非核心域分开考虑;

3)由于阅读程序需要从细节和概念上理解,因此修改程序德的投入会远远大于最初编程的投入;

1、字节对齐概念
现代计算机中,内存空间按照字节划分,理论上可以从任何起始地址访问任意类型的变量。但实际中在访问特定类型变量时经常在特定的内存地址访问,这就需要各种类型数据按照一定的规则在空间上排列,而不是顺序一个接一个地存放,这就是对齐。
2、结构体对齐
在C语言中,结构体是种复合数据类型,其构成元素既可以是基本数据类型(如int、long、float等)的变量,也可以是一些复合数据类型(如数组、结构体、联合等)的数据单元。编译器为结构体的每个成员按照其自然边界(alignment)分配空间。各成员按照它们被声明的顺序在内存中顺序存储,第一个成员的地址和整个结构的地址相同。
字节对齐的问题主要就是针对结构体。
3、示例
struct A{
int a;
char b;
short c;
};
struct B{
char b;
int a;
short c;
};
已知32位机器上各数据类型的长度为:char为1字节、short为2字节、int为4字节、long为4字节、float为4字节、double为8字节。那么上面两个结构体大小如何呢?
结果是:sizeof(strcut A)值为8;sizeof(struct B)的值却是12。
结构体A中包含一个4字节的int数据,一个1字节char数据和一个2字节short数据;B也一样。按理说A和B大小应该都是7字节。之所以出现上述结果,就是因为编译器要对数据成员在空间上进行对齐。
4、对齐准则
1) 数据类型自身的对齐值:char型数据自身对齐值为1字节,short型数据为2字节,int/float型为4字节,double型为8字节。
2) 结构体或类的自身对齐值:其成员中自身对齐值最大的那个值。
3) 指定对齐值:#pragma pack (value)时的指定对齐值value。
4) 数据成员、结构体和类的有效对齐值:自身对齐值和指定对齐值中较小者,即有效对齐值=min{自身对齐值,当前指定的pack值}。
结构体字节对齐的细节和具体编译器实现相关,但一般而言满足三个准则:
1) 结构体变量的首地址能够被其最宽基本类型成员的大小所整除;
2) 结构体每个成员相对结构体首地址的偏移量(offset)都是成员大小的整数倍,如有需要编译器会在成员之间加上填充字节(internal adding);
3) 结构体的总大小为结构体最宽基本类型成员大小的整数倍,如有需要编译器会在最末一个成员之后加上填充字节{trailing padding}。
对于以上规则的说明如下:
第一条:编译器在给结构体开辟空间时,首先找到结构体中最宽的基本数据类型,然后寻找内存地址能被该基本数据类型所整除的位置,作为结构体的首地址。将这个最宽的基本数据类型的大小作为上面介绍的对齐模数。
第二条:为结构体的一个成员开辟空间之前,编译器首先检查预开辟空间的首地址相对于结构体首地址的偏移是否是本成员大小的整数倍,若是,则存放本成员,反之,则在本成员和上一个成员之间填充一定的字节,以达到整数倍的要求,也就是将预开辟空间的首地址后移几个字节。
第三条:结构体总大小是包括填充字节,最后一个成员满足上面两条以外,还必须满足第三条,否则就必须在最后填充几个字节以达到本条要求。

### C语言结构体对齐的原理和实现方式 #### 一、结构体对齐的基本概念 在C语言中,为了提高数据访问效率以及满足硬件架构的要求,编译器会对结构体中的成员进行字节对齐处理。这种对齐遵循一定的规则,主要包括以下几个方面: 1. **第一个成员的位置** 结构体的第一个成员始终存储在其分配空间的起始地址上[^1]。 2. **其他成员的对齐规则** 其他成员会存储在一个称为“对齐数”的整数倍地址上。这个对齐数值取决于两个因素:一是该成员自身的大小;二是当前使用的编译器设置的默认对齐值。最终的实际对齐数是两者之间的较小值[^1]。 3. **不同平台下的差异** 编译器的不同可能导致对齐策略有所区别。例如,在Windows平台上使用Microsoft Visual Studio时,默认对齐数通常为8字节;而在Linux环境下GCC编译器则可能采用4字节作为默认对齐单位[^1]。 4. **整体大小调整** 整个结构体的总尺寸会被扩展到内部所有成员中最长对齐需求长度的一个整数倍。这意味着如果最后一个字段不需要额外填充来达到这一目标,则不会增加多余的空间消耗[^3]。 #### 二、具体实例分析 下面通过几个具体的代码片段进一步说明上述理论如何应用实践当中: ##### 示例1: 单纯字符型与整形组合情况 考虑以下简单定义: ```c #pragma pack(8) // 设置全局对齐参数为8字节 struct Example { char ch; int num; }; ``` 这里`ch`占据单个字节而`num`需要四个连续字节存放。由于我们指定了较大的打包指令(`pack=8`),所以即使只有这两个元素存在也至少得预留八位给整个对象[`sizeof(struct Example)`返回值应等于8][^2]. ##### 示例2: 复杂嵌套情形 再来看一段稍微复杂一点的例子涉及到了子结构体的情况: ```c #pragma pack(push, 8) typedef struct _s1{ short a; /* size = 2 */ long b; /* size = 4 or 8 depending on architecture*/ } S1; typedef struct _s2{ char c; /* size = 1 */ S1 d; /* contains 'a' and 'b', total aligned to max of them */ int e; /* size = 4 */ }s2; #pragma pack(pop) ``` 在这个场景里,S1类型的变量d本身又包含了多个属性因此它自己的布局也要考虑到各自的数据类型特性再加上外部施加的影响共同决定最后的结果即`s2`的整体规模应该是可以被最高级别也就是long或者double之类的大容量单元所接受的形式呈现出来[^4]. #### 三、总结 综上所述,C编程环境里的记录式复合数据形式——结构体会因为多种原因经历一系列复杂的排列过程从而形成特定模式下的物理表现形态这其中包括但不限于初始定位点选取原则、后续各项间间隔距离设定依据还有总体框架外围边界划定标准等等诸多环节相互作用最终达成既定目的同时兼顾性能优化考量. --- 相关问题
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值