计算字节对齐的地址 ((sizeof(n)+sizeof(int)-1)&~(sizeof(int)-1))

本文详细解析了一段C语言代码中用于计算可变参数字节对齐的宏,通过数学模型和位运算深入解释了内存对齐的原理,包括如何通过位移和掩码操作来获取变量占用的机器字数目,以及如何通过取模运算来解决实际编程中遇到的字节对齐问题。

http://blog.chinaunix.net/uid-7900822-id-3010964.html

 

((sizeof(n)+sizeof(int)-1)&~(sizeof(int)-1))

一、问题的提出
两年之前我写过一篇可变参数学习笔记,里面曾经简单的解释过一句:
代码
((sizeof(n)+sizeof(int)-1)&~(sizeof(int)-1))
的作用是在考虑字节对齐的因素下计算第一个可变参数的起始地址。
当时限于时间和水平,未能做更详细的解释。
今天(2007-11-26)在csdn论坛上看到了一个帖子
http://topic.youkuaiyun.com/u/20071123/16/c8d17d3f-9f49-49af-a6d8-1d7a7d84dc1c.html?seed=303711257
问题:CRT源码分析中一个关于可变函数参数的问题
提问者:Sun_Moon_Stars
里面又问到了这个宏,于是决定抽出半天时间,把这个问题详细的说清楚。也算是把我的那篇文章
做一个完美的结尾。

二、引子
先看一个日常生活中的问题,
问题1:假设有要把一批货物放到集装箱里,货物有12件,
一个箱子最多能装6件货物,求箱子的数目。
解答:显然我们需要12/6=2个箱子,并且每个箱子都是满的。这个连小学生都会算:-)

问题2:       把问题1的条件改一下,假设一个箱子最多能装5件货物,那么现在的箱子数是多少?
解答:       12/5=2.4个,但是根据实际情况,箱子的个数必须为整数,(有不知道这个常识的就不要再往下看了,
回小学重读吧,呵呵)自然我们就要取3,
下面把问题一般化

三、一般数学模型
问题3:设一个箱子最多可以装M件货物,且现有N件货物,
则至少需要多少个箱子,给出一般的计算公式。
这里要注意两点
1、箱子的总数必须为整数
2、N不一定大于M,很显然,即使N <M,也得需要一只箱子

四、通项公式
1、预备知识
在讨论之问题3的解答之前,我们先明确一下/运算符的含义。
定义/运算为取整运算,即
对任意两个整数N,M,必然有且只有唯一的整数X,满足
X*M   <=   N   <   (X+1)*M,那么记N/M=X。
这个也正是c里/运算的确切含义。x的存在性和唯一性的严格证明可以见数论教材。
以后如无额外说明,/运算的含义均和本处一致。

/运算有一个基本的性质
若N=MX+Y,则N/M=X+Y/M,证明略

注意:N不是可以随便拆的,设N=A+B,那么一般情况下N/M   不一定等于   A/M+B/M,
如果A和B至少有一个是M的倍数,才能保证式子一定成立。

2、分步讨论
根据上面的/运算符的定义,我们可以得到问题三的解答,分情况讨论一下
已知N/M=X,那么当
(1)、当N正好是M的倍数时即N=M*X时,那么箱子数就是X=N/M
(2)、如果N不是M的倍数,即N=M*X+Y(1 <=Y <M)时
那么显然还要多一个箱子来装余下的Y件货物,
则箱子总数为X+1   =   N/M+1

3、一般公式
上面的解答虽然完整,但是用起来并不方便,因为每次都要去判断N和M的倍数关系,
我们自然就要想一个统一的公式,于是,下面的公式出现了
箱子数目为     (N+M-1)/M

这个式子用具体数字去验证是很简单的,留给读者去做。
我这里给一个完整的数学推导:
现在已经假定   /运算的结果为取整(或者说取模),即
N/M=X,则XM   <=N   <(X+1)M
那么,
(1)、当N=MX时,(N+M-1)/M=   MX/M+(M-1)/M=X
(2)、当N=MX+Y(1 <=Y <M)时,
由1 <=Y   <   M,同时加上M-1,得到M   <=   Y-1+M   <=   2M-1   <2M
根据   /运算的定义   (Y-1+M)   /M   =   1

所以 (N+M-1)/M   =   (MX+Y+M-1)/M=   MX/M+(Y+M-1)/M=   X+1
显然   公式   (N+M-1)/M与2中的分步讨论结果一致。
可能有的读者还会问,这个公式是怎么想出来的,怎么就想到了加上那个M-1?
这个问题可以先去看看数论中的余数理论。

五、对齐代码的分析
有了上面的数学基础,我们再来看看开头所说的对齐代码的含义
((sizeof(n)+sizeof(int)-1)&~(sizeof(int)-1))
意义就很明显了
这里。机器字长度sizeof(int)相当于箱子的容量M,变量的真实字节大小相于
货物总数N,整个代码就是求n所占的机器字数目。

顺便仔细的解释一下
~(sizeof(int)-1))

这里用到了一个位运算的技巧,即若M是2的幂,M=power(2,Y);

则N/M   =  N>>Y  ,

另根据数论中的余数定理,

有N=M*X+Z(1 <   =Z <  M)
而注意到这里的N,M,Z都是二进制表示,所以把N的最右边的Y位数字就是余数Z.
剩下的左边数字就是模X.

而内存对齐要计算的是占用的总字节数(相当于箱子的最大容量),所以

总字节数 = ( N/M)*M =( N>>Y)<<Y

注意,这里的右移和左移运算并未相互抵消,最后的结果实际上是把N中的余数Z去掉(被清0),

而左边模X得以保持不变。

而当M = power(2,Y) 时

(N >>Y) << Y = (N   &(~(M-1))也是一个恒等式(这个读者也可以用数字验证),

所以,就得到我们前面看到的宏

((sizeof(n)+sizeof(int)-1)&~(sizeof(int)-1))

注意:
(1)这里最关键的一点就是M必须是2的幂(有人常常理解成2的倍数也可以,那是不对的),
否则上面的结论是不成立的
(2)   ~(M-1)更专业的叫法就是掩码(mask)。因为数字和这个掩码进行与运算后,数字的最右边Y位的
数字被置0("掩抹"掉了).即掩码最右边的0有多少位,数字最右边就有多少位被清0。

小结:
1、字节对齐的数学本质就是数论中的取模运算。在计算机上的含义就是求出一个对象占用的机器字数目。
2、在数学上看内存计算的过程就是先右移再左移相同的位数,以得到箱子的最大容量。

3、在c中/运算可以用位运算和掩码来实现以加快速度(省掉了求位数的过程),前提是机器字长度必须为2的幂。

——————————————————

#define _INTSIZEOF(n) ( (sizeof(n) + sizeof(int) – 1) & ~(sizeof(int) – 1)

[此问题的推荐答案]
~是位取反的意思。
_INTSIZEOF(n)整个做的事情就是将n的长度化为int长度的整数倍。
比如n为5,二进制就是101b,int长度为4,二进制为100b,那么n化为int长度的整数倍就应该为8。
~(sizeof(int) – 1) )就应该为~(4-1)=~(00000011b)=11111100b,这样任何数& ~(sizeof(int) – 1) )后最后两位肯定为0,就肯定是4的整数倍了。
(sizeof(n) + sizeof(int) – 1)就是将大于4m但小于等于4(m+1)的数提高到大于等于4(m+1)但小于4(m+2),这样再& ~(sizeof(int) – 1) )后就正好将原长度补齐到4的倍数了。

 

### C/C++ `sizeof` 计算结构体字节对齐规则 在C/C++中,编译器为了提高访问速度会对结构体内成员按照一定规则进行排列,这被称为字节对齐。不同类型的变量有不同的默认对齐需求,在32位系统上常见类型及其自然边界如下: - `char`: 1字节 - `short`: 2字节 - `int`, `float`: 4字节 - `double`, `long long`: 8字节 当定义一个结构体时,其总大小不仅取决于各成员本身的长度之和,还要考虑这些成员之间的填充以及整个结构体结束后的额外填充以满足特定的对齐要求。 #### 示例分析 对于给定的例子[^1],两个不同的结构体A和B展示了由于字段顺序变化而导致的不同内存布局效果: ```c struct A { char a; short b; int c; }; struct B { char a; int c; short b; }; ``` 假设是在典型的32位平台上,则有: - 对于`struct A`而言,第一个字符只需要占用1个字节的空间;接着是一个短整型(`short`),它需要2个连续的字节空间,因此在这两者之间会有一个字节被浪费作为填充来使得`b`能够位于偶数地址处开始存储;最后是四个字节宽的整形(`int`),所以最终的结果将是1+1(用于填补)+2+4=8字节。 - 而对于`struct B`来说,虽然同样包含了相同的数据项但是因为它们的位置发生了改变&mdash;&mdash;首先是单字节宽度的字符,之后紧跟着四字节宽度的整形,这意味着不需要任何内部填充就能让后续元素按最优方式放置;而紧跟在其后面的两字节宽度的短整型也正好可以紧接着前者的结尾存放而不必增加额外开销,故此情况下总的尺寸应为1+(3个字节用来补足到下一个合适的起始位置)+4+2=12字节。 上述结论可以通过下面这段测试程序验证: ```c #include &lt;stdio.h&gt; struct A{ char a; short b; int c; }; struct B{ char a; int c; short b; }; int main(){ printf(&quot;sizeof(struct A)=%d\n&quot;, sizeof(struct A)); printf(&quot;sizeof(struct B)=%d\n&quot;, sizeof(struct B)); return 0; } ``` 另一个例子来自另一份资料[^2],其中描述了一个更复杂的结构体实例: ```c struct test { char x1; short x2; float x3; char x4; }; ``` 在这个案例里,如果遵循标准的字节对齐原则的话,那么实际分配给这个结构体的内存量将会超过各个组成部分所占空间简单的相加值。具体来讲就是:首部的一个字符占据了一字节加上三个字节的空白区域以便使接下来的双字节数据能正确地定位;随后浮点数值占据了四个连续的字节;最后一个单独存在的字符则再次引入了三字节的间隙确保整体符合最接近的倍数关系。综上所述,该结构体会消耗总共十二个字节的记忆容量而不是预期中的十个。 此外,还可以通过预处理指令如`#pragma pack(n)`来调整默认的行为模式,这里n代表指定的新对齐因子。例如,设置成1就可以关闭自动补齐机制从而减少不必要的空间损耗,但这可能会降低CPU读取效率。观察取消打包命令前后的影响可以帮助理解这一点[^3]: ```c #include &lt;stdio.h&gt; #include &lt;stdlib.h&gt; typedef struct IntPair_s { char c; int num; } IntPair; int main(void){ size_t IntPairSize = sizeof(IntPair); printf(&quot;Size of IntPair = %zu\n&quot;, IntPairSize); return 0; } ```
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值