边界对齐问题

本文深入探讨了结构体边界对齐的概念,解释了不同处理器架构(如Intel IA32和ARM)下的对齐规则及其实现原理,并通过具体示例说明了如何在编程中应用这些规则。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

结构体边界对齐



  许多实际的计算机系统对基本类型数据在内存中存放的位置有限制,它们会要求这些数据的首地址的值是某个数k(通常它为4或8)的倍数,这就是所谓的内存对齐,而这个k则被称为该数据类型的对齐模数(alignment modulus)。当一种类型S的对齐模数与另一种类型T的对齐模数的比值是大于1的整数,我们就称类型S的对齐要求比T强(严格),而称T比S弱(宽松)。这种强制的要求一来简化了处理器与内存之间传输系统的设计,二来可以提升读取数据的速度。比如这么一种处理器,它每次读写内存的时候都从某个8倍数的地址开始,一次读出或写入8个字节的数据,假如软件能保证double类型的数据都从8倍数地址开始,那么读或写一个double类型数据就只需要一次内存操作。否则,我们就可能需要两次内存操作才能完成这个动作,因为数据或许恰好横跨在两个符合对齐要求的8字节内存块上。某些处理器在数据不满足对齐要求的情况下可能会出错,但是Intel的IA32架构的处理器则不管数据是否对齐都能正确工作。不过Intel奉劝大家,如果想提升性能,那么所有的程序数据都应该尽可能地对齐。

 

规则:

  第一,编译器按照成员列表的顺序给每个成员分配内存.
  第二,当成员需要满足正确的边界对齐时,成员之间用额外字节填充.
  第三,结构体的首地址必须满足结构体中边界要求最为严格的数据类型所要求的地址.
  第四,结构体的大小为其最宽基本类型的整数倍.

 

  sizeof操作符能够得出一个结构体的整体长度,包括因边界对齐而额外填充的那些字节.

  offsetof(type, member)宏能求得成员在结构体内的偏移,返回size_t.


关于struct的边界对齐问题
Intel、微软等公司曾经出过一道类似的面试题:

1. #include <iostream.h>

2. #pragma pack(8)
3. struct example1
4. {
5. short a;
6. long b;
7. };

8. struct example2
9. {
10. char c;
11. example1 struct1;
12. short e;    
13. };
14. #pragma pack()

15. int main(int argc, char* argv[])
16. {
17. example2 struct2;

18. cout << sizeof(example1) << endl;
19. cout << sizeof(example2) << endl;
20. cout << (unsigned int)(&struct2.struct1) - (unsigned int)(&struct2) << endl;

21. return 0;
22. }

问程序的输入结果是什么?

答案是:

8
16
4

  不明白?还是不明白?下面一一道来:

2.1 自然对界

  struct是一种复合数据类型,其构成元素既可以是基本数据类型(如int、long、float等)的变量,也可以是一些复合数据类型(如 array、struct、union等)的数据单元。对于结构体,编译器会自动进行成员变量的对齐,以提高运算效率。缺省情况下,编译器为结构体的每个 成员按其自然对界(natural alignment)条件分配空间。各个成员按照它们被声明的顺序在内存中顺序存储,第一个成员的地址和整个结构的地址相同。

  自然对界(natural alignment)即默认对齐方式,是指按结构体的成员中size最大的成员对齐。

  例如:

struct naturalalign
{
char a;
short b;
char c;
};
  在上述结构体中,size最大的是short,其长度为2字节,因而结构体中的char成员a、c都以2为单位对齐,sizeof(naturalalign)的结果等于6;

  如果改为:

struct naturalalign
{
char a;
int b;
char c;
};
  其结果显然为12。

2.2指定对界

  一般地,可以通过下面的方法来改变缺省的对界条件:

  · 使用伪指令#pragma pack (n),编译器将按照n个字节对齐;
  · 使用伪指令#pragma pack (),取消自定义字节对齐方式。

  注意:如果#pragma pack (n)中指定的n大于结构体中最大成员的size,则其不起作用,结构体仍然按照size最大的成员进行对界。

  例如:

#pragma pack (n)
struct naturalalign
{
char a;
int b;
char c;
};
#pragma pack ()
  当n为4、8、16时,其对齐方式均一样,sizeof(naturalalign)的结果都等于12。而当n为2时,其发挥了作用,使得sizeof(naturalalign)的结果为8。

  在VC++ 6.0编译器中,我们可以指定其对界方式,其操作方式为依次选择projetct > setting > C/C++菜单,在struct member alignment中指定你要的对界方式。

  另外,通过__attribute((aligned (n)))也可以让所作用的结构体成员对齐在n字节边界上,但是它较少被使用,因而不作详细讲解。

2.3 面试题的解答

  至此,我们可以对Intel、微软的面试题进行全面的解答。

  程序中第2行#pragma pack (8)虽然指定了对界为8,但是由于struct example1中的成员最大size为4(long变量size为4),故struct example1仍然按4字节对界,struct example1的size为8,即第18行的输出结果;

  struct example2中包含了struct example1,其本身包含的简单数据成员的最大size为2(short变量e),但是因为其包含了struct example1,而struct example1中的最大成员size为4,struct example2也应以4对界,因为8大于4,所以#pragma pack (8)中指定的对界对struct example2也不起作用,故19行的输出结果为16;

  由于struct example2中的成员以4为单位对界,故其char变量c后应补充3个空,其后才是成员struct1的内存空间,20行的输出结果为4。

 

补充:上面说的还不是很清楚,总结一下:在默认情况下,VC规定各个成员变量存放的起始地址相对于结构的起始地址的偏移量必须为该类型所占字节数的 倍数。 同时为了确保结构的大小为字节边界数(结构中占用最大空间 的类型所占用的字节数)的倍数,所以在为最后一个成员变量申请空间后,还会根据需要自动填充空缺的字节。(supermonkey注: 其实这里相当于把example1的成员展开到example2中来判断!)



ARM内存边界对齐以及sizeof问题
[ 2011-7-14 5:28:00 | By: 五谷道场 ]
 

默认情况下,在32位cpu里,gcc对于结构体的对齐方式是按照四个字节来对齐的。看以下结构体

  typedef struct pack{

  char a;

  int b;

  short c;

  }pack;

  对于Pack结构体,默认情况下在arm/386平台下(别的平台没试过)sizeof(pack)=12,求解过程如下:

  sizeof(char)=1;

  下一个int b,由于是四个字节,要求b的开始地址从32的整数倍开始,故需要在a后面填充3个没用的字节,记为dump(3),sizeof(b)=4,此时相当于结构体扩充为

  char a;

  char dump(3);

  int b;

  看short c,现在c的前面有8个字节,c是两个字节,c的开始地址是从16的整数开始,在b前面不需再加东西.此时对于结构体来说,sizeof(pack)=10,但是这不是最终结果,最后总的字节数也要能被4个字节整除,所以还需在short c后面再加

  dump(2);

  故总的字节数为12.

  当然以上说的只是简单的情况,下面谈谈arm,x86在gcc里关于内存边界字节对齐的区别.对于同样的结构体,在386下

  #prama pack(1)

  后,sizeof(pack)=1 4 2=7

  而在arm下同样的操作sizeof(pack)=1 4 2 1=8,即虽然b根a之间不要填充但总的长度必须要是4的整数倍.

  在arm 下要使结构体按指定字节对齐,可行的方法

  1.在makefile里加-fpack-struct 选项,这样的话对所有的结构按一字节对齐.

  不得不说,确实有那么些质量较差的程序可能需要你部分自然对齐,部分一字 节对齐,此时

  2. typedef struct pack{

  }__attribute__((packed))

  可利用__attribute__属性

  当然最后的方式,还是自己去看arm体系结构与gcc编译选项了。


### 指令边界对齐的概念 在计算机体系结构中,指令边界对齐是一个重要的概念,它涉及到如何将数据或指令存储在内存中的特定位置以便于高效访问。通常情况下,为了提高性能并减少硬件复杂度,处理器会要求某些类型的变量或者指令被放置在地址能够被某个数值整除的位置上[^1]。 当提到具体实现细节时,对于结构体内的字段来说,编译器可能会自动调整它们之间的填充空间使得每一个字段都能满足其自身的对齐需求;而对于整个结构本身而言,则可能还需要额外增加一些字节来确保该结构实例的整体大小也是符合预期的对齐方式[^2]。 ### 度量方法 要衡量当前系统是否存在因未正确处理好这些规则而导致效率低下等问题可以从以下几个方面入手: - **时间开销分析**:通过测量程序执行前后所需的时间差可以间接反映出由于不良布局引发的数据加载延迟现象。如果发现频繁发生缓存缺失或者其他异常情况,则可能是由不当排列引起的。 - **空间利用率评估**:查看实际分配给某段连续区域所需的总容量是否超出理论最小值太多也可以帮助判断是否有不必要的空白浪费存在其中。理想状态下应该尽量接近最佳紧凑状态而不会因为过多预留间隔造成资源闲置状况恶化。 ### 优化策略 针对上述可能出现的问题点提出了几种可行性的解决方案如下所示: #### 调整数据类型顺序 重新规划定义内部组成成分次序从而达到更优组合效果的目的之一就是把那些具有相同属性特征或者说相近尺寸规格的对象集中安排在一起这样既可以简化管理流程又能有效降低整体占用水平同时还能兼顾读写速度方面的考量因素[^3]. ```c++ struct Example { char c; // 占用 1 字节 // 填充至下一个 4 的倍数处 (共补足 3 字节) int i; // 占用 4 字节 }; // 总计: 8 字节 (含隐式填充) // 改善后的版本: struct ImprovedExample { int i; // 占用 4 字节 char c; // 占用 1 字节 // 不再需要额外填充 }; // 总计: 5 字节 或者经过适当扩展后成为最邻近合适的单位长度即 8 字节 ``` #### 使用显式的打包声明 有时即使遵循常规惯例仍无法完全消除潜在隐患因此引入特殊的关键词如 `__attribute__((packed))` 来强制关闭默认行为进而获得更加精确可控的结果尽管这样做也许会在一定程度牺牲部分运行效能但是却能显著增强灵活性适应更多特殊场景下的定制化需求. ```cpp #pragma pack(push, 1) // 设置新的对齐模式为一字节对齐 struct PackedStruct { uint8_t a; uint16_t b; uint32_t c; } __attribute__((packed)); // GCC/Clang 版本指定紧缩特性 #pragma pack(pop) // 恢复原有设置 ```
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值