什么是内存对齐?
为什么要内存对齐?
先上一段代码
#include "stdafx.h"
#include <stdio.h>
#include <stdlib.h>
typedef struct
{
char a;
int b;
short c;
}A;
typedef struct
{
int a;
char b;
short c;
}B;
int _tmain(int argc, _TCHAR* argv[])
{
printf("sizeof(A) = %d; sizeof(B) = %d\n\r", sizeof(A), sizeof(B));
system("pause");
return 0;
}
运行结果
为什么sizeof(A)=12,而sizeof(B)=8呢?结构体成员数据类型一样(顺序不一样),为什么会产生不一样的结果呢?
这个例子体现了结构体的内存对齐。
内存对齐,也叫做字节对齐,它主要是指数据在内存中存储时,其起始地址应放置在该数据项大小的整数倍的内存位置上。
具体说明如下:
以代码中的两个结构体为例,从结构体的首地址开始,假设地址从0开始,
对结构体A来说,a是char类型占1个字节,占0的字节,b是int类型占4个字节,占从4~7的字节,c是short类型占2个字节,从8~11的字节。
对结构体B来说,a是int类型占4个字节,从0~3的字节,b是char类型占1个字节,占4的字节;c是short类型占2个字节,从6~7。
这就是内存对齐。
以下内容摘自:https://www.cnblogs.com/jijiji/p/4854581.html
接下来我们好好讨论一下内存对齐的作用?
1.平台原因(移植原因):不是所有的硬件平台都能访问任意地址上的任意数据,某些硬件平台只能在某些地址处取某些特定类型的数据,否则抛出硬件异常
2.硬件原因:经过内存对齐之后,CPU的内存访问速度大大提升。具体原因接下来解释
图一:
我们普通程序员心中的内存印象,由一个个字节组成,但是CPU却不是这么看待的
图二:
cpu把内存当成是一块一块的,块的大小可以是2,4,8,16 个字节,因此CPU在读取内存的时候是一块一块进行读取的,块的大小称为(memory granularity)内存读取粒度。
我们再来看看为什么内存不对齐会影响读取速度?
假设CPU要读取一个4字节大小的数据到寄存器中(假设内存读取粒度是4),分两种情况讨论:
1.数据从0字节开始
2.数据从1字节开始
解析:当数据从0字节开始的时候,直接将0-3四个字节完全读取到寄存器,结算完成了。
当数据从1字节开始的时候,问题很复杂,首先先将前4个字节读到寄存器,并再次读取4-7字节的数据进寄存器,接着把0字节,4,6,7字节的数据剔除,最后合并1,2,3,4字节的数据进寄存器,对一个内存未对齐的寄存器进行了这么多额外操作,大大降低了CPU的性能。
但是这还属于乐观情况,上文提到内存对齐的作用之一是平台的移植原因,因为只有部分CPU肯干,其他部分CPU遇到未对齐边界就直接罢工了。
参考图片: