汇编语言总结
一、常用寄存器
32位寄存器有16个,分别是:
4个数据寄存器(EAX、EBX、ECX、EDX)。
2个变址和指针寄存器(ESI和EDI);2个指针寄存器(ESP和EBP)。
6个段寄存器(ES、CS、SS、DS、FS、GS)。
1个指令指针寄存器(EIP);1个标志寄存器(EFlags)。
1.1 通用寄存器
eax 累加和结果寄存器(Accumulator Register)
ebx 基地址寄存器(Base Register)
ecx 计数寄存器(Count Register)
edx 数据寄存器(Data Register)
esi 源地址寄存器 (Index Register)
edi 目的地址寄存器(Index Register)
esp 堆栈顶指针寄存器(Stack Point)
ebp 堆栈基指针寄存器(Base Point)
- 寄存器分为8,16,32( l, 小写L),64( r )
- b,w,l,q分别代表8,16,32,64位
1.2 段寄存器
CS 代码段寄存器
ES 附加段寄存器
DS 数据段寄存器
FS 附加段寄存器
SS 堆栈段寄存器
GS 附加段寄存器
二、汇编命令
pushl %eax
# 等效下面
subl $4, %esp
movl %eax, (%esp)
popl %eax
# 等效下面
movl (%esp), %eax,
addl $4, %esp
call 0x12345
# 等效下面, (*)表示eip不能被程序员直接使用
pushl %eip (*)
movl $0x12345, %eip (*)
ret
# 等效下面, (*)表示eip不能被程序员直接使用
popl %eip (*)
三、寻址方式
- 立即数寻址方式,直接将值加载到目标位置中
# 等效于 edx = 0x123
movl $0x123, %edx
- 直接寻址方式,通过地址或偏移来实现
# 等效于 edx = *(int32_t*)0x123
movl 0x123, %edx
- 索引(变址)寻址方式,通过地址或偏移以及%索引寄存器部分实现。你可以将任何通用寄存器用作索引寄存器。
# 该指令把数组的第%ebx个元素传送到edx寄存器中。
# data_items是数组的首地址, ebx的值是数组的下标,4表示数组的每个元素占4字节,
# 那么数组中第ebx个元素的地址应该是data_items+ebx*4。
movl data_items( , %ebx, 4 ), %edx
- 间接寻址方式,以寄存器中的值作为地址,获得这个地址里的值。
# 等效于 edx = *(int32_t*)ebx
movl (%ebx), %edx
- 基址寻址方式,和间接寻址类似,但多了一个常量和寄存器中的地址相加
# 等效于 edx = *(int32_t*)(ebx + 4)
movl 4(%ebx), %edx
- 寄存器寻址方式,就是数据的移入移出
# 等效 edx = eax
movl %eax, %edx
四、嵌入式汇编
基本格式:
__asm__("汇编语句"
: 输出寄存器
: 输入寄存器
: 会被修改的寄存器);
__asm__ __volatile__ ("<asm routine>"
: output
: input
: modify);
-
输出寄存器: 表示这段汇编执行完之后,哪些寄存器用于存放输出数据。
这些寄存器会分别对应一C语言表达式值或一个内存地址; -
输入寄存器: 表示在开始执行汇编代码时,这里指定的一些寄存器中应存放的输入值,它们也分别对应着一C变量或常数值。
-
会被修改的寄存器: 表示你已经对其中列出的寄存器中的值进行了改动,gcc编译器不能再依赖于它原先对这些寄寄存器加载的值。如果必要的话,gcc需要重新加载这些寄存器。
加上前缀’%‘的数字(如%0,%1)表示的就是需要使用寄存器的"样板"操作数。
指令部中使用了几个样板操作数,就表明有几个变量需要与寄存器相结合,这样GCC和GAS在编译和汇编时会根据后面给定的约束条件进行恰当的处理。
由于样板操作数也使用’%‘作为前缀,因此在涉及到具体的寄存器时,寄存器名前面应该加’%%’,以免产生混淆。
// 有返回值的宏函数
#define get_seg_byte(seg, addr) \
({ \
register char __res; \ // 定义了一个寄存器变量__res
// 这行开始的4行是汇编语句,语法是AT&T
__asm__("push %%fs; \
mov %%ax, %%fs; \
movb %%fs:%2, %%al; \
pop %%fs" \
// 输出寄存器,=代表是输出寄存器,a代表eax,运行结束后将eax里的值放入__res变量中
: "=a" (__res) \
// 输入寄存器,0表示与上面相同位置上的输出寄存器,eax;m表示使用内存地址
: "0" (seg), "m" (*(addr))); \
__res;}) // 返回值
常用寄存器加载代码说明
代码 | 说明 | 代码 | 说明 |
---|---|---|---|
a | 使用寄存器eax | m | 使用内存地址 |
b | 使用寄存器ebx | o | 使用内存地址并可以加偏移值 |
c | 使用寄存器ecx | I | 使用常数0-31 |
d | 使用寄存器edx | J | 使用常数0-63 |
S | 使用esi | K | 使用常数0-255 |
D | 使用edi | L | 使用常数0-65535 |
q | 使用动态分配字节可寻址寄存器(eax,ebx,ecx或edx) | M | 使用常数0-3 |
r | 使用任意动态分配的寄存器 | N | 使用1字节常数(0-255) |
g | 使用通用有效的地址即可(eax,ebx,ecx,edx或内存变量) | O | 使用常数0-31 |
A | 使用eax与edx联合(64位) | = | 输出操作数,输出值将替换前值 |
+ | 表示操作数可读可写 | & | 早期汇编的操作数。表示在使用完操作数之前,内容会被修改 |