内存对齐

什么是内存对齐?

为什么要内存对齐?

先上一段代码

#include "stdafx.h"
#include <stdio.h>
#include <stdlib.h>

typedef struct
{
    char a;
    int b;
    short c;
}A;

typedef struct
{
    int a;
    char b;
    short c;
}B;


int _tmain(int argc, _TCHAR* argv[])
{
    printf("sizeof(A) = %d; sizeof(B) = %d\n\r", sizeof(A), sizeof(B));

    system("pause");

	return 0;
}

运行结果

为什么sizeof(A)=12,而sizeof(B)=8呢?结构体成员数据类型一样(顺序不一样),为什么会产生不一样的结果呢? 
这个例子体现了结构体的内存对齐。 

内存对齐,也叫做字节对齐,它主要是指数据在内存中存储时,其起始地址应放置在该数据项大小的整数倍的内存位置上

具体说明如下:
以代码中的两个结构体为例,从结构体的首地址开始,假设地址从0开始, 
对结构体A来说,a是char类型占1个字节,占0的字节,b是int类型占4个字节,占从4~7的字节,c是short类型占2个字节,从8~11的字节。 
对结构体B来说,a是int类型占4个字节,从0~3的字节,b是char类型占1个字节,占4的字节;c是short类型占2个字节,从6~7。 
这就是内存对齐。

 

以下内容摘自:https://www.cnblogs.com/jijiji/p/4854581.html

接下来我们好好讨论一下内存对齐的作用?

  1.平台原因(移植原因):不是所有的硬件平台都能访问任意地址上的任意数据,某些硬件平台只能在某些地址处取某些特定类型的数据,否则抛出硬件异常

  2.硬件原因:经过内存对齐之后,CPU的内存访问速度大大提升。具体原因接下来解释

图一:

我们普通程序员心中的内存印象,由一个个字节组成,但是CPU却不是这么看待的

图二:

cpu把内存当成是一块一块的,块的大小可以是2,4,8,16 个字节,因此CPU在读取内存的时候是一块一块进行读取的,块的大小称为(memory granularity)内存读取粒度。

我们再来看看为什么内存不对齐会影响读取速度?

    假设CPU要读取一个4字节大小的数据到寄存器中(假设内存读取粒度是4),分两种情况讨论:

           1.数据从0字节开始

        2.数据从1字节开始

解析:当数据从0字节开始的时候,直接将0-3四个字节完全读取到寄存器,结算完成了。

        当数据从1字节开始的时候,问题很复杂,首先先将前4个字节读到寄存器,并再次读取4-7字节的数据进寄存器,接着把0字节,4,6,7字节的数据剔除,最后合并1,2,3,4字节的数据进寄存器,对一个内存未对齐的寄存器进行了这么多额外操作,大大降低了CPU的性能。

     但是这还属于乐观情况,上文提到内存对齐的作用之一是平台的移植原因,因为只有部分CPU肯干,其他部分CPU遇到未对齐边界就直接罢工了。

参考图片:

转载于:https://my.oschina.net/871120/blog/3007994

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值