Linux Debugging(二): 熟悉AT&T汇编语言

本文详细对比了AT&T和Intel汇编语言的语法差异,包括寄存器命名、操作数顺序、常数/立即数的格式、操作数长度标识及寻址方式的不同,并通过一个数组最大值查找实例加深读者对于AT&T汇编语法的理解。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

没想到《Linux Debugging:使用反汇编理解C++程序函数调用栈》发表了收到了大家的欢迎。但是有网友留言说不熟悉汇编,因此本书列了汇编的基础语法。这些对于我们平时的调试应该是够用了。

1 AT&T与Intel汇编语法对比

本科时候大家学的基本上都是Intel的8086汇编语言,微软采用的就是这种格式的汇编。GCC采用的是AT&T的汇编格式, 也叫GAS格式(Gnu ASembler GNU汇编器)。

1、寄存器命名不同

AT&TIntel说明
%eaxeaxIntel的不带百分号


2、操作数顺序不同

AT&TIntel说明
movl %eax, %ebxmov ebx, eaxIntel的目的操作数在前,源操作数在后;AT&T相反


3、常数/立即数的格式不同

AT&TIntel说明
movl $_value,%ebxmov eax,_valueIntel的立即数前面不带$符号
movl $0xd00d,%ebxmov ebx,0xd00d规则同样适用于16进制的立即数


4、操作数长度标识

AT&TIntel说明
movw %ax,%bxmov bx,axIntel的汇编中, 操作数的长度并不通过指令符号来标识。
AT&T的格式中, 每个操作都有一个字符后缀, 表明操作数的大小. 例如:mov指令有三种形式:
movb 传送字节
movw 传送字
movl 传送双字
如果没有指定操作数长度的话,编译器将按照目标操作数的长度来设置。比如指令“mov %ax, %bx”,由于目标操作数bx的长度为word,那么编译器将把此指令等同于“movw %ax, %bx”。

5、寻址方式

AT&TIntel说明
imm32(basepointer,
indexpointer,
indexscale)
[basepointer + indexpointer*indexscale + imm32)

两种寻址的实际结果都应该是

imm32 + basepointer + indexpointer*indexscale
例如: 下面是一些寻址的例子:

AT&TIntel说明
mov 4(%ebp), %eaxmov eax, [ebp + 4]基址寻址(Base Pointer Addressing Mode),用于访问结构体成员比较方便,例如一个结构体的基地址保存在eax寄存器中,其中一个成员在结构体内的偏移量是4字节,要把这个成员读上来就可以用这条指令
data_items(,%edi,4)[data_items+edi*4变址寻址(Indexed Addressing Mode),访问数组
movl $addr, %eaxmov eax, addr直接寻址(Direct Addressing Mode)
movl (%eax), %ebxmov ebx, [eax]间接寻址(Indirect Addressing Mode),把eax寄存器的值看作地址,把内存中这个地址处的32位数传送到ebx寄存器
mov $12, %eaxmov eax, 12立即数寻址(Immediate Mode)
mov $12, %eaxmov eax, 12寄存器寻址(Register Addressing Mode

6.跳转方式不同

AT&T 汇编格式中,绝对转移和调用指令(jump/call)的操作数前要加上'*'作为前缀,而在 Intel 格式中则不需要。

AT&TIntel说明
jmp *%eaxjmp %eax用寄存器%eax中的值作为跳转目标
jmp *(%eax)jmp (%eax)以%eax中的值作为读入的地址, 从存储器中读出跳转目标

2 求一个数组最大数

通过求一个数组的最大数,来进一步学习AT&T的语法

  1. #PURPOSE:Thisprogramfindsthemaximumnumberofa
  2. #setofdataitems.
  3. #
  4. #VARIABLES:Theregistershavethefollowinguses:
  5. #
  6. #%edi-Holdstheindexofthedataitembeingexamined
  7. #%ebx-Largestdataitemfound
  8. #%eax-Currentdataitem
  9. #
  10. #Thefollowingmemorylocationsareused:
  11. #
  12. #data_items-containstheitemdata.A0isused
  13. #toterminatethedata
  14. #
  15. .section.data#全局变量
  16. data_items:#Thesearethedataitems
  17. .long3,67,34,222,45,75,54,34,44,33,22,11,66,0
  18. .section.text
  19. .globl_start
  20. _start:
  21. movl$0,%edi#move0intotheindexregister
  22. movldata_items(,%edi,4),%eax#loadthefirstbyteofdata
  23. movl%eax,%ebx#sincethisisthefirstitem,%eaxis
  24. #thebiggest
  25. start_loop:#startloop
  26. cmpl$0,%eax#checktoseeifwe'vehittheend
  27. jeloop_exit
  28. incl%edi#loadnextvalue
  29. movldata_items(,%edi,4),%eax
  30. cmpl%ebx,%eax#comparevalues
  31. jlestart_loop#jumptoloopbeginningifthenew
  32. #oneisn'tbigger
  33. movl%eax,%ebx#movethevalueasthelargest
  34. jmpstart_loop#jumptoloopbeginning
  35. loop_exit:
  36. #%ebxisthestatuscodeforthe_exitsystemcall
  37. #anditalreadyhasthemaximumnumber
  38. movl$1,%eax#1isthe_exit()syscall
  39. int$0x80

汇编程序中以 .开头的名称并不是指令的助记符,不会被翻译成机器指令,而是给汇编器一些特殊指示,称为汇编指示(Assembler Directive)或伪操作(Pseudo-operation),由于它不是真正的指令所以加个“ ”字。 .section指示把代码划分成若干个段(Section),程序被操作系统加载执行时,每个段被加载到不同的地址,操作系统对不同的页面设置不同的读、写、执行权限。 .data段保存程序的数据,是可读可写的,相当于C++程序的全局变量。

.text段保存代码,是只读和可执行的,后面那些指令都属于.text段。

.long指示声明一组数,每个数占32;.quad类似,占64位;.byte是8位;.word 是16位。.ascii,例如.ascii "Hello world",声明11个数,取值为相应字符的ASCII码。

参考资料:

1. 最简单的汇编程序

2. 第二个汇编程序

3. http://blog.chinaunix.net/uid-27717694-id-3942757.html

最后复习一下lea命令:

mov 4(%ebp) %eax #将%ebp+4地址处所存的值,mov到%eax

leal 4(%ebp) %eax #将%ebp+4的地址值, mov到%eax

leal 可以被mov取代:

addl $4, %ebp

mov. %ebp, %eax


<think>我们正在处理关于使用objdump工具对vmlinux和.ko文件进行反汇编的问题。根据提供的引用,我们可以总结出以下关键点: 1. **vmlinux**:是未压缩的内核ELF文件,用于调试,可以生成符号表(如system.map),但不能直接用于启动内核(引用[4])。 2. **.ko文件**:是内核模块文件。 3. **objdump命令**:用于反汇编目标文件或可执行文件。 根据引用[1]和引用[2]中的示例,我们可以提取出使用objdump进行反汇编的基本命令格式。 ### 步骤说明 #### 1. 反汇编vmlinux - 使用objdump反汇编vmlinux文件,并输出到指定文件。由于vmlinux文件较大,反汇编可能需要很长时间,并且生成的文件也会很大(如引用[2]中提到的503MB)。 - 命令示例(引用[2]): ```bash arm-none-eabi-objdump -DzS vmlinux > linux.dump ``` 解释: - `-D`:反汇编所有段(包括数据段)。 - `-z`:显示零块(通常用于显示未初始化的数据段)。 - `-S`:尽可能将源代码与汇编代码混合显示(需要编译时使用`-g`选项生成调试信息)。 - `vmlinux`:输入文件。 - `> linux.dump`:将输出重定向到文件。 注意:这里使用了交叉编译工具链的前缀`arm-none-eabi-`,因为目标架构是ARM。对于不同的架构,需要使用对应的工具链(如aarch64-linux-android-objdump等)。 #### 2. 反汇编.ko文件 - 引用[1]中给出了反汇编.ko文件的示例: ```bash aarch64-linux-androidkernel-objdump -d -M intel -S hello.ko > objdump.txt ``` 解释: - `-d`:只反汇编代码段(text section)。 - `-M intel`:使用Intel语法显示汇编代码(默认是AT&T语法,可选)。 - `-S`:混合源代码和汇编代码(需要调试信息)。 - `hello.ko`:输入的内核模块文件。 - `> objdump.txt`:输出到文件。 注意:这里同样使用了交叉编译工具链(`aarch64-linux-androidkernel-objdump`)。 ### 通用步骤 1. **确定目标架构和工具链**: - 根据目标平台(如ARM、x86等)选择合适的objdump工具。通常,交叉编译工具链中会提供对应的objdump,如`arm-linux-gnueabi-objdump`、`aarch64-linux-gnu-objdump`等。 2. **反汇编命令**: - 对于vmlinux,通常使用`-D`(反汇编所有段)和`-S`(混合源代码)选项,以便获取更全面的信息。 - 对于.ko文件,如果只需要代码段,可以使用`-d`;如果需要所有段,则使用`-D`。 3. **输出重定向**: - 由于输出内容很多,通常将结果重定向到文件。 ### 具体命令示例 #### 反汇编vmlinux(以ARM架构为例) ```bash # 使用交叉编译工具链中的objdump arm-none-eabi-objdump -DzS vmlinux > vmlinux.dump ``` #### 反汇编.ko文件(以ARM64架构为例) ```bash aarch64-linux-androidkernel-objdump -d -S hello.ko > hello.ko.dump ``` ### 注意事项 - **调试信息**:如果希望反汇编时显示源代码,需要在编译内核或模块时添加`-g`选项(生成调试信息)。否则,`-S`选项可能不会显示源代码。 - **时间与空间**:反汇编vmlinux可能需要数小时(如引用[2]中在虚拟机上花了6小时),并且生成的dump文件可能非常大(几百MB),确保有足够的磁盘空间。 - **架构匹配**:必须使用与目标文件相匹配的objdump版本(即交叉编译工具链中的objdump),否则可能无法正确反汇编。 ### 相关问题 根据用户的问题,我们可以生成以下相关问题: 1. 如何为特定的架构选择正确的objdump工具? 2. 反汇编vmlinux时,如何减少生成文件的大小? 3. 如果没有调试信息(即编译时没有使用-g选项),反汇编的结果会有什么不同? 4. 如何利用反汇编结果进行内核调试或问题定位? 5. 除了objdump,还有哪些工具可以用于反汇编内核和模块? ### 总结回答 用户询问如何使用objdump对vmlinux和.ko文件进行反汇编。我们根据引用提供了具体的命令示例和注意事项。关键点包括选择正确的工具链、使用合适的选项(如-D、-S等)以及重定向输出到文件。同时,我们提醒用户注意时间和空间开销,以及调试信息的重要性。</think>### 使用 objdump 反汇编 Linux 内核文件 vmlinux 和模块文件 .ko #### **1. 反汇编 vmlinux 文件** vmlinux 是未压缩的原始内核 ELF 文件,包含完整的调试符号(需编译时启用 `-g` 选项)。反汇编命令如下: ```bash # 通用架构(替换工具链前缀) <toolchain>-objdump -DzS vmlinux > vmlinux.dump # ARM 架构示例(引用[2][3]) arm-none-eabi-objdump -DzS vmlinux > linux.dump # Intel 语法示例(引用[1]) objdump -d -M intel -S vmlinux > vmlinux_intel.dump ``` **关键参数说明**: - `-D`:反汇编所有段(包括数据段) - `-z`:显示零块(增强可读性) - `-S`:混合源代码与汇编(需编译时加 `-g` 调试选项) - `> filename`:输出重定向到文件 > **注意事项**: > - 反汇编 vmlinux 耗时极长(约 6 小时),生成文件可达 500MB+ [^2][^3] > - 必须使用**匹配内核架构的交叉编译工具链**(如 `aarch64-linux-android-objdump`) --- #### **2. 反汇编 .ko 内核模块** 针对内核模块文件(如 `hello.ko`),命令格式为: ```bash # 基础反汇编 <toolchain>-objdump -d hello.ko > module_dump.txt # 混合源代码(需调试信息) <toolchain>-objdump -d -S hello.ko > module_with_source.txt # Intel 语法示例(引用[1]) aarch64-linux-androidkernel-objdump -d -M intel -S hello.ko > objdump.txt ``` **参数说明**: - `-d`:仅反汇编代码段(text section) - `-M intel`:指定 Intel 汇编语法(默认 AT&T 语法) - 模块需包含调试符号(编译时加 `CONFIG_DEBUG_INFO=y`) --- #### **3. 关键实践要点** 1. **调试信息依赖**: - 混合源代码需内核/模块编译时启用调试选项(如 `make CONFIG_DEBUG_INFO=y`) - 否则 `-S` 参数无效(仅显示汇编) 2. **工具链选择**: - ARM 架构:`arm-linux-gnueabi-objdump` 或 `aarch64-linux-androidkernel-objdump` [^1] - x86 架构:直接使用系统 `objdump`(需安装 `binutils`) 3. **分析技巧**: - 结合 `System.map` 定位符号地址:`grep "symbol_name" System.map` - OOPS 错误定位:通过指令指针地址在反汇编中搜索 `grep -n "address" vmlinux.dump` > **重要提示**: > vmlinux 是原始 ELF 文件,不可直接引导系统,仅供调试使用 [^4]。反汇编结果需结合 `addr2line`、`gdb` 等工具进行深度分析。 --- ### 相关问题 1. **如何减少 vmlinux 反汇编文件的大小?** (提示:使用 `-j .text` 限定代码段) 2. **反汇编时出现 "no debugging symbols found" 警告怎么办?** (提示:检查内核编译配置 `CONFIG_DEBUG_INFO`) 3. **如何通过反汇编结果定位内核 panic 的具体代码行?** (提示:结合 OOPS 输出的指令指针地址) 4. **objdump 与 gdb 在内核调试中的优劣对比?** (提示:静态分析 vs 动态调试) 5. **交叉编译工具链不匹配会导致什么问题?** (提示:指令解码错误、段解析失败) [^1]: Linux调试之(四)objdump+vmlinux [^2]: 反汇编命令耗时与文件大小示例 [^3]: ARM Linux內核驅動異常定位調試 [^4]: vmlinux 文件特性说明 [^5]: 内核模块依赖信息示例
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值