汇编中的结构体表示

本文探讨了在汇编语言中如何表示和访问C/C++中的结构体,指出结构体本质上是一堆连续的数据,成员的访问通过地址偏移实现。以一个具体的测试代码为例,展示了结构体成员在汇编代码中的赋值操作,并提到了内存对齐在结构体布局中的重要性,以及如何通过`#pragma pack(n)`调整内存对齐规则。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

我认为,汇编中一切皆地址。

在c/c++使用很多的结构体,在汇编中是如何表示的呢?其实,在汇编中根本就没有什么结构体的概念,结构体本质就是一堆连在一起的数据。只不过有人把他们想象成一个整体,并以此产生结构体的概念,这与结构体中带有变长数组时候的情形一样:

 

其实上面这个结构体尾部带有的变长数组,data[0]与结构体Test没有任何关系,sizeof(Test)就知道。

 

结构体在汇编是如何表示的呢?

譬如如何访问Test中的x成员,其实就是采用地址偏移的方式,根据定义的Test对象的起始地址,偏移一定的大小就可以访问结构体中的不同成员了。

 

测试代码:

 

 

gcc -S xxxx

 

产生的汇编代码如下:

 

 

由c++filt 查看_ZN4TestC1Ev 知道为Test::Test(),也即Test结构体的构造函数,看看这个函数的具体情况,

movl    8(%ebp), %eax //把this指针的地址放入eax

然后看它如何给第一个成员变量赋值:

movl    $0, (%eax) //将值0放入eax的值所对应的内存地址处,也就是给第一个成员变量赋值

同理:

 movl    8(%ebp), %eax

 movb    $0, 4(%eax) //4(%eax)表示eax+4所对应的内存地址处,也就是第二个成员变量处

由以上分析就很明显了,汇编中访问结构体成员采用的是地址偏移的方式,其实c/c++等高级语言,编译之后都要转换成汇编代码,所以,结构体的底层访问,就是采用的地址偏移的方式。

 

注意:

结构体中有一个重要的概念,内存对齐,它会改变结构体成员变量的偏移值。

windows和linux都有默认的地址对齐大小,一般4字节,以利于cpu访问数据,因为cpu一般数据总线32位,可以一次访问4字节大小。

用#pragma pack(n) 可以改变内存对齐大小。

 

结构体内存对齐原则很复杂,特别是结构体中套一个结构体的时候,但是简单说来,有两点原则:

1,每个成员(基本数据类型,也就是int,bool,char等)的偏移值由两个数据决定:其数据类型所占大小(记为变量X),例如int型占4字节;

编译器设置的内存对齐大小,默认的,或是你通过上述指令设置的大小(记为变量Y),取两者中的较小值,得到数据Z。根据内存对齐原 则,该成员变量的偏移值必须是Z的倍数。

2,假如结构体中占内存最大的成员大小为M,则结构体总大小必须是M的倍数。

 

综上,用汇编要对结构体的内存模型很熟悉。

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值