C++字节对齐问题

关于C++字节对齐问题

关于C/C++的字节对齐

这两天写解析SWF文件的程序,在结构体指针和从文件中读出来的进行转换的时候遇到一些问题,就是有一个struct A,例如:

struct A

{

         char flag;

         int length;

         int id; 

         ....

};

然后一个飘逸的 struct A *a = (struct A*)buffer;   // 世界一下清静咯

可惜在输出a中的成员的时候却发现老是不正确,百思不得起解。今晚一想,可能是由于C++的字节对齐问题,所以直接就百度了一些

C++的字节对齐。看到下面这篇文章说的挺清晰的,就转了过来。

________________________________________________________________________________________________________

关于C/C++的字节对齐

最近研究C++的数据类型和数据大小时发现,字节对齐实际上是一个C/C++程序员无法忽视的一个问题.所以进行了初步的研究.

1.为什么会出现内存对齐问题-从x86 CPU架构说起
相信绝大多数计算机系和软件学院的学生都学过计算机组成原理这门基础课程,所以不作入门引导了,没有相关背景的可以补补相关课程资料.常有人问我,既然是按字节寻址方式,为何会出现字节对齐问题呢?难道是内存不是连续的吗?
这个问题实际上和CPU与内存的连接方式有关,我们知道CPU会通过地址总线Address BUS与CPU连接用于寻址,用Data Bus数据总线连接用于获取数据,而内存通常是RAM构成的复杂阵列。

对于这个RAM阵列(实际内存可能更复杂,但是原理类似), 前16个内存地址排列对应内存单元关系如下:



对照上图,是不是发现,对于每个内存操作周期,每个地址实际上可以读取4个bytes的数据呢,那么假设你有一个int型的数据存储在地址1或者2或者 3,那么,是不是一个CPU内存时钟周期不够取出这个数据呢?这样是不是效率会很低下?这也就是为什么我们需要内存对齐了,虽然现代CPU和编译器已经对 此做了很多优化,但是C/C++由于特殊性,程序员必须了解这个细节.

2.C/C++内存对齐的方式
C/C++中的结构/类的成员变量在对齐在内存中的排列是与它们摆放的先后顺序相关的,先看看下面的结构

1 struct malign_a
2 {
3    char a;
4    short b;
5    char c;
6    int d;
7 };

这个结构的sizeof(malign_a)是多少呢?1+2+1+4 =8?吗?这个实际上不对,那么,如何对齐的呢?
由于char是1个byte,所以不管他在什么位置,都可以用一个内存周期读出数据,short是半个字也就是2 bytes,这个时候假如它的地址是某个边界位置上,那么,也需要两个内存周期来读取,以此类推.所以,内存对齐就是加入填充padding无意义的数据 来保证某个数据位于一个可以通过最少内存周期的位置,比如double型只有地址位于%4等于0的位置,才能保证2个周期读出.

同时对于每个具体平台,不同的编译器有不同的指定的对齐模式,比如C/C++可以通过

1 #pragma pack(n) //n为1,2,4,8,16等

来指定对齐.当然,一般x86 32位机器下,都是默认4字节对齐的.这个n也称为对齐模数.
对齐策略如下:

1.结构体成员对齐:按某成员数据本身大小以及指定大小中较小者对齐
2.结构体整体对齐:按所有成员中最大者和对齐模数中较小者对齐

所以上述结构体按默认对齐方式如下:

1.a是char类型,可以在任意位置,位于位置0
2.b是short类型,2比默认的4小,所以按2字节对齐,所以在a后面填充1个字节,b必须位于位置2,占两个字节
3.c是char类型,位于位置4
4.d是int类型,4<=4,所以按4字节对齐,需要在c后面填充3个字节,位置为8
5.由于最大成员是4,默认是4,所以结构已经按4对齐,所以总字节数为12


再把原来的结构体成员位置改动一下:

1 struct malign_b
2 {
3    char a;
4    char c;
5    short b;
6    int d;
7 };

这个结构的大小为8,对齐过程如下:

1.a是char类型,可以在任意位置,位于位置0
2.c是char类型,位于位置1
3.b是short类型,2比默认的4小,所以按2字节对齐,这时候恰好位于位置2
4.d是int类型,4 5.由于最大成员是4,默认是4,所以结构已经按4对齐,所以总字节数为8


最后为了加深理解,我们来看看下面这个结构按对齐模数2对齐时候的memory layout

01 #pragma pack(push)
02 #pragma pack(2)
03 struct malign_b
04 {
05    char a;
06    int d;
07    char c;
08    short b;
09 };
10 #pragma pack(pop)

它的大小为10,当指定为对齐模数2时候

1.由于a是char,1<2,位于位置0
2.由于d是int,4>2,所以按2字节对齐,所以必须在a后面填充一个字节,位于位置2,
3.c是char,位置为6
4.b是short,所以必须在c后面填充一个字节,位置为8
5.最大的是4,所以按2对齐,上述结果其实已经整体是按2对齐,所以总数为10


我相信通过以上例子,应该可以熟悉字节对齐过程了,如果有不妥之处,敬请留言指出,谢谢.
原文链接: http://www.cnblogs.com/shihao/archive/2012/01/18/2325580.html
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值