可执行文件的内容分析工具

最新推荐文章于 2025-09-14 15:51:26 发布

转载最新推荐文章于 2025-09-14 15:51:26 发布 · 4.4k 阅读

文章标签：

#工具 #编译器 #c #汇编 #object #unix

Linux编程(C编程)相关专栏收录该内容

7 篇文章

订阅专栏

Bill Zimmerly (bill@zimmerly.com), 自由撰稿人兼知识工程师, Author

级别: 中级

2007 年 3 月 06 日

　　UNIX(R) 系统中运行的程序遵守一种称为目标文件格式的精心设计。了解更多关于目标文件格式的内容，以及可以用来研究系统中目标文件的工具。

　　计算机编程的最新技术将一种特殊的人性与一组特殊的工具结合在一起，用以生产出对其他人非常有帮助的一种神奇的产品，即软件。计算机程序员是一群注重细节的人，他们可以处理计算机中各种各样的困难。计算机的要求非常苛刻，并且不能容忍其中存在任何的偏差。毫无疑问，无论您的个性如何以及在工作中使用了何种辅助工具，计算机程序的编写都是非常困难的。

　　在 UNIX® 和 Linux® 中，任何事物都是文件。您可以认为，UNIX 和 Linux 编程实际上是编写处理各种文件的代码。系统由许多类型的文件组成，但目标文件具有一种特殊的设计，提供了灵活和多样的用途。

　　目标文件是包含带有附加地址和值的助记符号的路线图。这些符号可以用来对各种代码段和数据段进行命名，包括经过初始化的和未初始化的。它们也可以用来定位嵌入的调试信息，就像语义 Web，非常适合由程序进行阅读。

行业工具

　　计算机编程中使用的工具包括代码编辑器，如 vi 或 Emacs，您可以使用这些工具输入和编辑希望计算机在完成所需任务时执行的指令，以及编译器和连接器，它们可以生成真正实现这些目标的机器代码。

　　高级的工具，称为集成调试环境 (IDE)，它以统一的外观集成了不同工具的功能。IDE 使得编辑器、编译器、连接器和调试器之间的界限变得很模糊。因此，为了更深入地研究和了解系统，在使用集成的套件之前，最好先单独地使用这些工具。（注意：IDE 也通常被称为集成开发环境。）

　　编译器可以将您在代码编辑器中创建的文本转换为目标文件。最初，目标文件被称为代码的中间表示形式，因为它用作连接编辑器（即连接器）的输入，而连接编辑器最终完成整个任务并生成可执行的程序作为输出。

　　从代码到可执行代码的转换过程经过了良好的定义并实现了自动化，而目标文件是这个链中有机的连接性环节。在这个转换过程中，目标文件作为连接编辑器所使用的映象，使得它们能够解析各种符号并将不同的代码和数据段连接在一起形成统一的整体。

历史

　　计算机编程领域中存在许多著名的目标文件格式。DOS 系列包括 COM、OBJ 和 EXE 格式。UNIX 和 Linux 使用 a.out、COFF 和 ELF。Microsoft® Windows® 使用可移植的执行文件 (PE) 格式，而 Macintosh 使用 PEF、Mach-O 和其他文件格式。

　　最初，各种类型的计算机具有自己独特的目标文件格式，但随着 UNIX 和其他在不同硬件平台上提供可移植性的操作系统的出现，一些常用的文件格式上升为通用的标准。其中包括 a.out、COFF 和 ELF 格式。

　　要了解目标文件，需要一组可以读取目标文件中不同部分并以更易于读取的格式显示这些内容的工具。本文将讨论这些工具中比较重要的方面。但首先，您必须创建一个工作台，并在其中建立一个研究对象。

工作台

　　启动一个 xterm 会话，让我们先创建一个空白的工作台，并开始对目标文件进行研究。下面的命令创建了一个目录，可以将目标文件放到该目录中进行研究：

　　$ mkdir src $ cd src $ mkdir hw $ cd hw

　　然后，使用您最喜欢的代码编辑器，在 $HOME/src/hw 目录中输入清单 1 中的程序，并命名为 hw.c。

　　清单 1. hw.c 程序

　　#include <stdio.h> int main(void) { 　　printf("Hello World!/n"); 　　return 0; }

　　要使用 UNIX 工具库中提供的各种工具，可以将这个简单的“Hello World”程序作为研究的对象。您将学习构建和查看目标文件的输出，而不是使用任何快捷方法直接创建可执行文件（的确有许多这样的快捷方法）。

文件格式

　　C 编译器的正常输出是用于您所指定的目标处理器的汇编代码。汇编代码是汇编器的输入，在缺省情况下，汇编器将生成所有目标文件的祖先，即 a.out 文件。这个名称本身表示汇编输出 (Assembler Output)。要创建 a.out 文件，可以在 xterm 窗口中输入下面的命令：

　　cc hw.c
　　注意：如果出现了任何错误或者没有创建 a.out 文件，那么您可能需要检查自己的系统或源文件 (hw.c)，以找出其中的错误。还需要检查是否已将 cc 定义为运行您的 C/C++ 编译器。

　　最新的 C 编译器将编译和汇编步骤组合成一个步骤。您可以指定不同开关选项以查看 C 编译器的汇编输出。通过输入下面的命令，您可以看到 C 编译器的汇编输出：

　　cc -S hw.c
　　这个命令生成了一个新的文件 hw.s，其中包含您通常无法看到的汇编输入文本，因为编译器在缺省情况下将生成 a.out 文件。正如所预期的，UNIX 汇编程序可以对这种输入文件进行汇编，以生成 a.out 文件。

UNIX 特定的工具

　　假定编译过程一切顺利，那么在该目录中就有了一个 a.out 文件，下面让我们来对其进行研究。有许多可用于研究目标文件的有价值的工具，下面便是其中一组：

　　nm：列出目标文件中的符号。

　　objdump：显示目标文件中的详细信息。
　　readelf：显示关于 ELF 目标文件的信息。

　　列表中的第一个工具是 nm，它可以列出目标文件中的符号。如果您输入 nm 命令，您将注意到在缺省情况下，它会寻找一个名为 a.out 的文件。如果没有找到该文件，这个工具会给出相应的提示。然而，如果该工具找到了编译器创建的 a.out 文件，它将显示类似清单 2 的清单。

　　清单 2. nm 命令的输出

　　08049594 A __bss_start080482e4 t call_gmon_start 08049594 b completed.446308049498 d __CTOR_END__ 08049494 d __CTOR_LIST__ 08049588 D __data_start 08049588 W data_start 0804842c t __do_global_ctors_aux 0804830c t __do_global_dtors_aux 0804958c D __dso_handle 080494a0 d __DTOR_END__ 0804949c d __DTOR_LIST__ 080494a8 d _DYNAMIC 08049594 A _edata 08049598 A _end 08048458 T _fini 08049494 a __fini_array_end 08049494 a __fini_array_start 08048478 R _fp_hw 0804833b t frame_dummy 08048490 r __FRAME_END__ 08049574 d _GLOBAL_OFFSET_TABLE_ 　　　　　w __gmon_start__ 08048308 T __i686.get_pc_thunk.bx 08048278 T _init 08049494 a __init_array_end 08049494 a __init_array_start 0804847c R _IO_stdin_used 080494a4 d __JCR_END__ 080494a4 d __JCR_LIST__ 　　　　 w _Jv_RegisterClasses 080483e1 T __libc_csu_fini 08048390 T __libc_csu_init 　　　 U __libc_start_main@@GLIBC_2. 008048360 T main08049590 d p.4462 　　　 U puts@@GLIBC_2. 0080482c0 T _start

　　
　　这些包含可执行代码的段称为正文段。同样地，数据段包含了不可执行的信息或数据。另一种类型的段，称为 BSS 段，它包含以符号数据开头的块。

　　对于 nm 命令列出的每个符号，它们的值使用十六进制来表示（缺省行为），并且在该符号前面加上了一个表示符号类型的编码字符。常见的各种编码包括：

　　A 表示绝对 (absolute)，这意味着不能将该值更改为其他的连接；

　　B 表示 BSS 段中的符号；

　　C 表示引用未初始化的数据的一般符号。

　　可以将目标文件中所包含的不同的部分划分为段。段可以包含可执行代码、符号名称、初始数据值和许多其他类型的数据。有关这些类型的数据的详细信息，可以阅读 UNIX 中 nm 的 man 页面，其中按照该命令输出中的字符编码分别对每种类型进行了描述。

　　细节，细节…

　　在目标文件阶段，即使是一个简单的 Hello World 程序，其中也包含了大量的细节信息。nm 程序可用于列举符号及其类型和值，但是，要更仔细地研究目标文件中这些命名段的内容，需要使用功能更强大的工具。

　　其中两种功能强大的工具是 objdump 和 readelf 程序。通过输入下面的命令，您可以看到目标文件中包含可执行代码的每个段的汇编清单。对于这么一个小的程序，编译器生成了这么多的代码，真的很令人惊异！

　　objdump -d a.out
　　这个命令生成的输出如清单 3 所示。每个可执行代码段将在需要特定的事件时执行，这些事件包括库的初始化和该程序本身主入口点。

　　清单 3. objdump 命令的输出

　　a.out: file format elf64-x86-64 Disassembly of section .init: 00000000004003f8 <_init>: 4003f8: 48 83 ec 08 sub $0x8,%rsp 4003fc: e8 6b 00 00 00 callq 40046c <call_gmon_start> 400401: e8 ca 00 00 00 callq 4004d0 <frame_dummy> 400406: e8 a5 01 00 00 callq 4005b0 <__do_global_ctors_aux> 40040b: 48 83 c4 08 add $0x8,%rsp 40040f: c3 retq Disassembly of section .plt: 0000000000400410 <__libc_start_main@plt-0x10>: 400410: ff 35 7a 04 10 00 pushq 1049722(%rip) # 500890 <_GLOBAL_OFFSET_TABLE_+0x8> 400416: ff 25 7c 04 10 00 jmpq *1049724(%rip) # 500898 <_GLOBAL_OFFSET_TABLE_+0x10> 40041c: 90 nop 40041d: 90 nop 40041e: 90 nop 40041f: 90 nop 0000000000400420 <__libc_start_main@plt>: 400420: ff 25 7a 04 10 00 jmpq *1049722(%rip) # 5008a0 <_GLOBAL_OFFSET_TABLE_+0x18> 400426: 68 00 00 00 00 pushq $0x0 40042b: e9 e0 ff ff ff jmpq 400410 <_init+0x18> 0000000000400430 <puts@plt>: 400430: ff 25 72 04 10 00 jmpq *1049714(%rip) # 5008a8 <_GLOBAL_OFFSET_TABLE_+0x20> 400436: 68 01 00 00 00 pushq $0x1 40043b: e9 d0 ff ff ff jmpq 400410 <_init+0x18> Disassembly of section .text: 0000000000400440 <_start>: 400440: 31 ed xor %ebp,%ebp 400442: 49 89 d1 mov %rdx,%r9 400445: 5e pop %rsi 400446: 48 89 e2 mov %rsp,%rdx 400449: 48 83 e4 f0 and $0xfffffffffffffff0,%rsp 40044d: 50 push %rax 40044e: 54 push %rsp 40044f: 49 c7 c0 10 05 40 00 mov $0x400510,%r8 400456: 48 c7 c1 20 05 40 00 mov $0x400520,%rcx 40045d: 48 c7 c7 f8 04 40 00 mov $0x4004f8,%rdi 400464: e8 b7 ff ff ff callq 400420 <__libc_start_main@plt> 400469: f4 hlt 40046a: 90 nop 40046b: 90 nop 000000000040046c <call_gmon_start>: 40046c: 48 83 ec 08 sub $0x8,%rsp 400470: 48 8b 05 09 04 10 00 mov 1049609(%rip),%rax # 500880 <_DYNAMIC+0x190> 400477: 48 85 c0 test %rax,%rax 40047a: 74 02 je 40047e <call_gmon_start+0x12> 40047c: ff d0 callq *%rax 40047e: 48 83 c4 08 add $0x8,%rsp 400482: c3 retq 400483: 90 nop 400484: 90 nop 400485: 90 nop 400486: 90 nop 400487: 90 nop 400488: 90 nop 400489: 90 nop 40048a: 90 nop 40048b: 90 nop 40048c: 90 nop 40048d: 90 nop 40048e: 90 nop 40048f: 90 nop 0000000000400490 <__do_global_dtors_aux>: 400490: 80 3d 31 04 10 00 00 cmpb $0x0,1049649(%rip) # 5008c8 <__bss_start> 400497: 55 push %rbp 400498: 48 89 e5 mov %rsp,%rbp 40049b: 74 10 je 4004ad <__do_global_dtors_aux+0x1d> 40049d: eb 24 jmp 4004c3 <__do_global_dtors_aux+0x33> 40049f: 90 nop 4004a0: 48 83 c0 08 add $0x8,%rax 4004a4: 48 89 05 15 04 10 00 mov %rax,1049621(%rip) # 5008c0 <p.6104> 4004ab: ff d2 callq *%rdx 4004ad: 48 8b 05 0c 04 10 00 mov 1049612(%rip),%rax # 5008c0 <p.6104> 4004b4: 48 8b 10 mov (%rax),%rdx 4004b7: 48 85 d2 test %rdx,%rdx 4004ba: 75 e4 jne 4004a0 <__do_global_dtors_aux+0x10> 4004bc: c6 05 05 04 10 00 01 movb $0x1,1049605(%rip) # 5008c8 <__bss_start> 4004c3: c9 leaveq 4004c4: c3 retq 4004c5: 66 data16 4004c6: 66 data16 4004c7: 66 data16 4004c8: 90 nop 4004c9: 66 data16 4004ca: 66 data16 4004cb: 66 data16 4004cc: 90 nop 4004cd: 66 data16 4004ce: 66 data16 4004cf: 90 nop 00000000004004d0 <frame_dummy>: 4004d0: 55 push %rbp 4004d1: 48 83 3d 0f 02 10 00 cmpq $0x0,1049103(%rip) # 5006e8 <__JCR_END__> 4004d8: 00 4004d9: 48 89 e5 mov %rsp,%rbp 4004dc: 74 16 je 4004f4 <frame_dummy+0x24> 4004de: b8 00 00 00 00 mov $0x0,%eax 4004e3: 48 85 c0 test %rax,%rax 4004e6: 74 0c je 4004f4 <frame_dummy+0x24> 4004e8: bf e8 06 50 00 mov $0x5006e8,%edi 4004ed: 49 89 c3 mov %rax,%r11 4004f0: c9 leaveq 4004f1: 41 ff e3 jmpq *%r11 4004f4: c9 leaveq 4004f5: c3 retq 4004f6: 90 nop 4004f7: 90 nop 00000000004004f8 <main>: 4004f8: 55 push %rbp 4004f9: 48 89 e5 mov %rsp,%rbp 4004fc: bf f8 05 40 00 mov $0x4005f8,%edi 400501: e8 2a ff ff ff callq 400430 <puts@plt> 400506: b8 00 00 00 00 mov $0x0,%eax 40050b: c9 leaveq 40050c: c3 retq 40050d: 90 nop 40050e: 90 nop 40050f: 90 nop 0000000000400510 <__libc_csu_fini>: 400510: f3 c3 repz retq 400512: 66 data16 400513: 66 data16 400514: 66 data16 400515: 90 nop 400516: 66 data16 400517: 66 data16 400518: 66 data16 400519: 90 nop 40051a: 66 data16 40051b: 66 data16 40051c: 90 nop 40051d: 66 data16 40051e: 66 data16 40051f: 90 nop 0000000000400520 <__libc_csu_init>: 400520: 4c 89 64 24 e0 mov %r12,0xffffffffffffffe0(%rsp) 400525: 4c 89 6c 24 e8 mov %r13,0xffffffffffffffe8(%rsp) 40052a: 4c 8d 25 93 01 10 00 lea 1048979(%rip),%r12 # 5006c4 <__init_array_end> 400531: 4c 89 74 24 f0 mov %r14,0xfffffffffffffff0(%rsp) 400536: 4c 89 7c 24 f8 mov %r15,0xfffffffffffffff8(%rsp) 40053b: 49 89 f6 mov %rsi,%r14 40053e: 48 89 5c 24 d0 mov %rbx,0xffffffffffffffd0(%rsp) 400543: 48 89 6c 24 d8 mov %rbp,0xffffffffffffffd8(%rsp) 400548: 48 83 ec 38 sub $0x38,%rsp 40054c: 41 89 ff mov %edi,%r15d 40054f: 49 89 d5 mov %rdx,%r13 400552: e8 a1 fe ff ff callq 4003f8 <_init> 400557: 48 8d 05 66 01 10 00 lea 1048934(%rip),%rax # 5006c4 <__init_array_end> 40055e: 49 29 c4 sub %rax,%r12 400561: 49 c1 fc 03 sar $0x3,%r12 400565: 4d 85 e4 test %r12,%r12 400568: 74 1e je 400588 <__libc_csu_init+0x68> 40056a: 31 ed xor %ebp,%ebp 40056c: 48 89 c3 mov %rax,%rbx 40056f: 90 nop 400570: 48 83 c5 01 add $0x1,%rbp 400574: 4c 89 ea mov %r13,%rdx 400577: 4c 89 f6 mov %r14,%rsi 40057a: 44 89 ff mov %r15d,%edi 40057d: ff 13 callq *(%rbx) 40057f: 48 83 c3 08 add $0x8,%rbx 400583: 49 39 ec cmp %rbp,%r12 400586: 75 e8 jne 400570 <__libc_csu_init+0x50> 400588: 48 8b 5c 24 08 mov 0x8(%rsp),%rbx 40058d: 48 8b 6c 24 10 mov 0x10(%rsp),%rbp 400592: 4c 8b 64 24 18 mov 0x18(%rsp),%r12 400597: 4c 8b 6c 24 20 mov 0x20(%rsp),%r13 40059c: 4c 8b 74 24 28 mov 0x28(%rsp),%r14 4005a1: 4c 8b 7c 24 30 mov 0x30(%rsp),%r15 4005a6: 48 83 c4 38 add $0x38,%rsp 4005aa: c3 retq 4005ab: 90 nop 4005ac: 90 nop 4005ad: 90 nop 4005ae: 90 nop 4005af: 90 nop 00000000004005b0 <__do_global_ctors_aux>: 4005b0: 55 push %rbp 4005b1: 48 89 e5 mov %rsp,%rbp 4005b4: 53 push %rbx 4005b5: 48 83 ec 08 sub $0x8,%rsp 4005b9: 48 8b 05 08 01 10 00 mov 1048840(%rip),%rax # 5006c8 <__CTOR_LIST__> 4005c0: 48 83 f8 ff cmp $0xffffffffffffffff,%rax 4005c4: 74 15 je 4005db <__do_global_ctors_aux+0x2b> 4005c6: 31 db xor %ebx,%ebx 4005c8: ff d0 callq *%rax 4005ca: 48 8b 83 c0 06 50 00 mov 0x5006c0(%rbx),%rax 4005d1: 48 83 eb 08 sub $0x8,%rbx 4005d5: 48 83 f8 ff cmp $0xffffffffffffffff,%rax 4005d9: 75 ed jne 4005c8 <__do_global_ctors_aux+0x18> 4005db: 48 83 c4 08 add $0x8,%rsp 4005df: 5b pop %rbx 4005e0: c9 leaveq 4005e1: c3 retq 4005e2: 90 nop 4005e3: 90 nop Disassembly of section .fini: 00000000004005e4 <_fini>: 4005e4: 48 83 ec 08 sub $0x8,%rsp 4005e8: e8 a3 fe ff ff callq 400490 <__do_global_dtors_aux> 4005ed: 48 83 c4 08 add $0x8,%rsp 4005f1: c3 retq

　　对于那些着迷于底层编程细节的程序员来说，这是一个功能非常强大的工具，可用于研究编译器和汇编器的输出。细节信息，比如这段代码中所显示的这些信息，可以揭示有关本地处理器本身运行方式的很多内容。对该处理器制造商提供的技术文档进行深入的研究，您可以收集关于一些有价值的信息，通过这些信息可以深入地了解内部的运行机制，因为功能程序提供了清晰的输出。

　　类似地，readelf 程序也可以清楚地列出目标文件中的内容。输入下面的命令，您将可以看到这一点：

　　readelf -all a.out
　　这个命令生成的输出如清单 4 所示。ELF Header 为该文件中所有段入口显示了详细的摘要。在列举出这些 Header 中的内容之前，您可以看到 Header 的具体数目。在研究一个较大的目标文件时，该信息可能非常有用。

　　清单 4. readelf 命令的输出

　　ELF Header: Magic: 7f 45 4c 46 02 01 01 00 00 00 00 00 00 00 00 00 Class: ELF64 Data: 2's complement, little endian Version: 1 (current) OS/ABI: UNIX - System V ABI Version: 0 Type: EXEC (Executable file) Machine: Advanced Micro Devices X86-64 Version: 0x1 Entry point address: 0x400440 Start of program headers: 64 (bytes into file) Start of section headers: 4744 (bytes into file) Flags: 0x0 Size of this header: 64 (bytes) Size of program headers: 56 (bytes) Number of program headers: 9 Size of section headers: 64 (bytes) Number of section headers: 38 Section header string table index: 35 Section Headers: [Nr] Name Type Address Offset Size EntSize Flags Link Info Align [ 0] NULL 0000000000000000 00000000 0000000000000000 0000000000000000 0 0 0 [ 1] .interp PROGBITS 0000000000400238 00000238 000000000000001c 0000000000000000 A 0 0 1 [ 2] .note.ABI-tag NOTE 0000000000400254 00000254 0000000000000020 0000000000000000 A 0 0 4 [ 3] .note.SuSE NOTE 0000000000400274 00000274 0000000000000018 0000000000000000 A 0 0 4 [ 4] .hash HASH 0000000000400290 00000290 0000000000000028 0000000000000004 A 5 0 8 [ 5] .dynsym DYNSYM 00000000004002b8 000002b8 0000000000000078 0000000000000018 A 6 1 8 [ 6] .dynstr STRTAB 0000000000400330 00000330 0000000000000051 0000000000000000 A 0 0 1 [ 7] .gnu.version VERSYM 0000000000400382 00000382 000000000000000a 0000000000000002 A 5 0 2 [ 8] .gnu.version_r VERNEED 0000000000400390 00000390 0000000000000020 0000000000000000 A 6 1 8 [ 9] .rela.dyn RELA 00000000004003b0 000003b0 0000000000000018 0000000000000018 A 5 0 8 [10] .rela.plt RELA 00000000004003c8 000003c8 0000000000000030 0000000000000018 A 5 12 8 [11] .init PROGBITS 00000000004003f8 000003f8 0000000000000018 0000000000000000 AX 0 0 4 [12] .plt PROGBITS 0000000000400410 00000410 0000000000000030 0000000000000010 AX 0 0 4 [13] .text PROGBITS 0000000000400440 00000440 00000000000001a4 0000000000000000 AX 0 0 16 [14] .fini PROGBITS 00000000004005e4 000005e4 000000000000000e 0000000000000000 AX 0 0 4 [15] .rodata PROGBITS 00000000004005f4 000005f4 0000000000000011 0000000000000000 A 0 0 4 [16] .eh_frame_hdr PROGBITS 0000000000400608 00000608 0000000000000024 0000000000000000 A 0 0 4 [17] .eh_frame PROGBITS 0000000000400630 00000630 0000000000000094 0000000000000000 A 0 0 8 [18] .ctors PROGBITS 00000000005006c8 000006c8 0000000000000010 0000000000000000 WA 0 0 8 [19] .dtors PROGBITS 00000000005006d8 000006d8 0000000000000010 0000000000000000 WA 0 0 8 [20] .jcr PROGBITS 00000000005006e8 000006e8 0000000000000008 0000000000000000 WA 0 0 8 [21] .dynamic DYNAMIC 00000000005006f0 000006f0 0000000000000190 0000000000000010 WA 6 0 8 [22] .got PROGBITS 0000000000500880 00000880 0000000000000008 0000000000000008 WA 0 0 8 [23] .got.plt PROGBITS 0000000000500888 00000888 0000000000000028 0000000000000008 WA 0 0 8 [24] .data PROGBITS 00000000005008b0 000008b0 0000000000000018 0000000000000000 WA 0 0 8 [25] .bss NOBITS 00000000005008c8 000008c8 0000000000000008 0000000000000000 WA 0 0 4 [26] .comment PROGBITS 0000000000000000 000008c8 0000000000000173 0000000000000000 0 0 1 [27] .debug_aranges PROGBITS 0000000000000000 00000a40 00000000000000c0 0000000000000000 0 0 16 [28] .debug_pubnames PROGBITS 0000000000000000 00000b00 0000000000000040 0000000000000000 0 0 1 [29] .debug_info PROGBITS 0000000000000000 00000b40 000000000000028e 0000000000000000 0 0 1 [30] .debug_abbrev PROGBITS 0000000000000000 00000dce 00000000000000a3 0000000000000000 0 0 1 [31] .debug_line PROGBITS 0000000000000000 00000e71 000000000000016f 0000000000000000 0 0 1 [32] .debug_frame PROGBITS 0000000000000000 00000fe0 0000000000000038 0000000000000000 0 0 8 [33] .debug_str PROGBITS 0000000000000000 00001018 00000000000000c3 0000000000000000 0 0 1 [34] .debug_loc PROGBITS 0000000000000000 000010db 000000000000004c 0000000000000000 0 0 1 [35] .shstrtab STRTAB 0000000000000000 00001127 000000000000015a 0000000000000000 0 0 1 [36] .symtab SYMTAB 0000000000000000 00001c08 00000000000007c8 0000000000000018 37 66 8 [37] .strtab STRTAB 0000000000000000 000023d0 0000000000000297 0000000000000000 0 0 1 Key to Flags: W (write), A (alloc), X (execute), M (merge), S (strings) I (info), L (link order), G (group), x (unknown) O (extra OS processing required) o (OS specific), p (processor specific) There are no section groups in this file. Program Headers: Type Offset VirtAddr PhysAddr FileSiz MemSiz Flags Align PHDR 0x0000000000000040 0x0000000000400040 0x0000000000400040 0x00000000000001f8 0x00000000000001f8 R E 8 INTERP 0x0000000000000238 0x0000000000400238 0x0000000000400238 0x000000000000001c 0x000000000000001c R 1 [Requesting program interpreter: /lib64/ld-linux-x86-64.so.2] LOAD 0x0000000000000000 0x0000000000400000 0x0000000000400000 0x00000000000006c4 0x00000000000006c4 R E 100000 LOAD 0x00000000000006c8 0x00000000005006c8 0x00000000005006c8 0x0000000000000200 0x0000000000000208 RW 100000 DYNAMIC 0x00000000000006f0 0x00000000005006f0 0x00000000005006f0 0x0000000000000190 0x0000000000000190 RW 8 NOTE 0x0000000000000254 0x0000000000400254 0x0000000000400254 0x0000000000000020 0x0000000000000020 R 4 NOTE 0x0000000000000274 0x0000000000400274 0x0000000000400274 0x0000000000000018 0x0000000000000018 R 4 GNU_EH_FRAME 0x0000000000000608 0x0000000000400608 0x0000000000400608 0x0000000000000024 0x0000000000000024 R 4 GNU_STACK 0x0000000000000000 0x0000000000000000 0x0000000000000000 0x0000000000000000 0x0000000000000000 RW 8 Section to Segment mapping: Segment Sections... 00 01 .interp 02 .interp .note.ABI-tag .note.SuSE .hash .dynsym .dynstr .gnu.version .gnu.version_r .rela.dyn .rela.plt .init .plt .text .fini .rodata .eh_frame_hdr .eh_frame 03 .ctors .dtors .jcr .dynamic .got .got.plt .data .bss 04 .dynamic 05 .note.ABI-tag 06 .note.SuSE 07 .eh_frame_hdr 08 Dynamic section at offset 0x6f0 contains 20 entries: Tag Type Name/Value 0x0000000000000001 (NEEDED) Shared library: [libc.so.6] 0x000000000000000c (INIT) 0x4003f8 0x000000000000000d (FINI) 0x4005e4 0x0000000000000004 (HASH) 0x400290 0x0000000000000005 (STRTAB) 0x400330 0x0000000000000006 (SYMTAB) 0x4002b8 0x000000000000000a (STRSZ) 81 (bytes) 0x000000000000000b (SYMENT) 24 (bytes) 0x0000000000000015 (DEBUG) 0x0 0x0000000000000003 (PLTGOT) 0x500888 0x0000000000000002 (PLTRELSZ) 48 (bytes) 0x0000000000000014 (PLTREL) RELA 0x0000000000000017 (JMPREL) 0x4003c8 0x0000000000000007 (RELA) 0x4003b0 0x0000000000000008 (RELASZ) 24 (bytes) 0x0000000000000009 (RELAENT) 24 (bytes) 0x000000006ffffffe (VERNEED) 0x400390 0x000000006fffffff (VERNEEDNUM) 1 0x000000006ffffff0 (VERSYM) 0x400382 0x0000000000000000 (NULL) 0x0 Relocation section '.rela.dyn' at offset 0x3b0 contains 1 entries: Offset Info Type Sym. Value Sym. Name + Addend 000000500880 000400000006 R_X86_64_GLOB_DAT 0000000000000000 __gmon_start__ + 0 Relocation section '.rela.plt' at offset 0x3c8 contains 2 entries: Offset Info Type Sym. Value Sym. Name + Addend 0000005008a0 000100000007 R_X86_64_JUMP_SLO 0000000000000000 __libc_start_main + 0 0000005008a8 000200000007 R_X86_64_JUMP_SLO 0000000000000000 puts + 0 There are no unwind sections in this file. Symbol table '.dynsym' contains 5 entries: Num: Value Size Type Bind Vis Ndx Name 0: 0000000000000000 0 NOTYPE LOCAL DEFAULT UND 1: 0000000000000000 421 FUNC GLOBAL DEFAULT UND __libc_start_main@GLIBC_2.2.5 (2) 2: 0000000000000000 430 FUNC GLOBAL DEFAULT UND puts@GLIBC_2.2.5 (2) 3: 0000000000000000 0 NOTYPE WEAK DEFAULT UND _Jv_RegisterClasses 4: 0000000000000000 0 NOTYPE WEAK DEFAULT UND __gmon_start__ Symbol table '.symtab' contains 83 entries: Num: Value Size Type Bind Vis Ndx Name 0: 0000000000000000 0 NOTYPE LOCAL DEFAULT UND 1: 0000000000400238 0 SECTION LOCAL DEFAULT 1 2: 0000000000400254 0 SECTION LOCAL DEFAULT 2 3: 0000000000400274 0 SECTION LOCAL DEFAULT 3 4: 0000000000400290 0 SECTION LOCAL DEFAULT 4 5: 00000000004002b8 0 SECTION LOCAL DEFAULT 5 6: 0000000000400330 0 SECTION LOCAL DEFAULT 6 7: 0000000000400382 0 SECTION LOCAL DEFAULT 7 8: 0000000000400390 0 SECTION LOCAL DEFAULT 8 9: 00000000004003b0 0 SECTION LOCAL DEFAULT 9 10: 00000000004003c8 0 SECTION LOCAL DEFAULT 10 11: 00000000004003f8 0 SECTION LOCAL DEFAULT 11 12: 0000000000400410 0 SECTION LOCAL DEFAULT 12 13: 0000000000400440 0 SECTION LOCAL DEFAULT 13 14: 00000000004005e4 0 SECTION LOCAL DEFAULT 14 15: 00000000004005f4 0 SECTION LOCAL DEFAULT 15 16: 0000000000400608 0 SECTION LOCAL DEFAULT 16 17: 0000000000400630 0 SECTION LOCAL DEFAULT 17 18: 00000000005006c8 0 SECTION LOCAL DEFAULT 18 19: 00000000005006d8 0 SECTION LOCAL DEFAULT 19 20: 00000000005006e8 0 SECTION LOCAL DEFAULT 20 21: 00000000005006f0 0 SECTION LOCAL DEFAULT 21 22: 0000000000500880 0 SECTION LOCAL DEFAULT 22 23: 0000000000500888 0 SECTION LOCAL DEFAULT 23 24: 00000000005008b0 0 SECTION LOCAL DEFAULT 24 25: 00000000005008c8 0 SECTION LOCAL DEFAULT 25 26: 0000000000000000 0 SECTION LOCAL DEFAULT 26 27: 0000000000000000 0 SECTION LOCAL DEFAULT 27 28: 0000000000000000 0 SECTION LOCAL DEFAULT 28 29: 0000000000000000 0 SECTION LOCAL DEFAULT 29 30: 0000000000000000 0 SECTION LOCAL DEFAULT 30 31: 0000000000000000 0 SECTION LOCAL DEFAULT 31 32: 0000000000000000 0 SECTION LOCAL DEFAULT 32 33: 0000000000000000 0 SECTION LOCAL DEFAULT 33 34: 0000000000000000 0 SECTION LOCAL DEFAULT 34 35: 0000000000000000 0 SECTION LOCAL DEFAULT 35 36: 0000000000000000 0 SECTION LOCAL DEFAULT 36 37: 0000000000000000 0 SECTION LOCAL DEFAULT 37 38: 0000000000000000 0 FILE LOCAL DEFAULT ABS abi-note.S 39: 0000000000000000 0 FILE LOCAL DEFAULT ABS suse-note.S 40: 0000000000000000 0 FILE LOCAL DEFAULT ABS ../sysdeps/x86_64/elf/sta 41: 0000000000000000 0 FILE LOCAL DEFAULT ABS init.c 42: 0000000000000000 0 FILE LOCAL DEFAULT ABS initfini.c 43: 0000000000000000 0 FILE LOCAL DEFAULT ABS /usr/src/packages/BUILD/g 44: 000000000040046c 0 FUNC LOCAL DEFAULT 13 call_gmon_start 45: 0000000000000000 0 FILE LOCAL DEFAULT ABS crtstuff.c 46: 00000000005006c8 0 OBJECT LOCAL DEFAULT 18 __CTOR_LIST__ 47: 00000000005006d8 0 OBJECT LOCAL DEFAULT 19 __DTOR_LIST__ 48: 00000000005006e8 0 OBJECT LOCAL DEFAULT 20 __JCR_LIST__ 49: 00000000005008c8 1 OBJECT LOCAL DEFAULT 25 completed.6106 50: 00000000005008c0 0 OBJECT LOCAL DEFAULT 24 p.6104 51: 0000000000400490 0 FUNC LOCAL DEFAULT 13 __do_global_dtors_aux 52: 00000000004004d0 0 FUNC LOCAL DEFAULT 13 frame_dummy 53: 0000000000000000 0 FILE LOCAL DEFAULT ABS crtstuff.c 54: 00000000005006d0 0 OBJECT LOCAL DEFAULT 18 __CTOR_END__ 55: 00000000005006e0 0 OBJECT LOCAL DEFAULT 19 __DTOR_END__ 56: 00000000004006c0 0 OBJECT LOCAL DEFAULT 17 __FRAME_END__ 57: 00000000005006e8 0 OBJECT LOCAL DEFAULT 20 __JCR_END__ 58: 00000000004005b0 0 FUNC LOCAL DEFAULT 13 __do_global_ctors_aux 59: 0000000000000000 0 FILE LOCAL DEFAULT ABS initfini.c 60: 0000000000000000 0 FILE LOCAL DEFAULT ABS /usr/src/packages/BUILD/g 61: 0000000000000000 0 FILE LOCAL DEFAULT ABS a.c 62: 00000000005006f0 0 OBJECT LOCAL HIDDEN 21 _DYNAMIC 63: 00000000005006c4 0 NOTYPE LOCAL HIDDEN ABS __init_array_end 64: 0000000000500888 0 OBJECT LOCAL HIDDEN 23 _GLOBAL_OFFSET_TABLE_ 65: 00000000005006c4 0 NOTYPE LOCAL HIDDEN ABS __init_array_start 66: 0000000000000000 421 FUNC GLOBAL DEFAULT UND __libc_start_main@@GLIBC_ 67: 00000000005008b8 0 OBJECT GLOBAL HIDDEN 24 __dso_handle 68: 0000000000400510 2 FUNC GLOBAL DEFAULT 13 __libc_csu_fini 69: 00000000004003f8 0 FUNC GLOBAL DEFAULT 11 _init 70: 0000000000400440 0 FUNC GLOBAL DEFAULT 13 _start 71: 0000000000400520 139 FUNC GLOBAL DEFAULT 13 __libc_csu_init 72: 00000000005008c8 0 NOTYPE GLOBAL DEFAULT ABS __bss_start 73: 00000000004004f8 21 FUNC GLOBAL DEFAULT 13 main 74: 00000000005008b0 0 NOTYPE WEAK DEFAULT 24 data_start 75: 00000000004005e4 0 FUNC GLOBAL DEFAULT 14 _fini 76: 00000000005008c8 0 NOTYPE GLOBAL DEFAULT ABS _edata 77: 00000000005008d0 0 NOTYPE GLOBAL DEFAULT ABS _end 78: 0000000000000000 430 FUNC GLOBAL DEFAULT UND puts@@GLIBC_2.2.5 79: 00000000004005f4 4 OBJECT GLOBAL DEFAULT 15 _IO_stdin_used 80: 00000000005008b0 0 NOTYPE GLOBAL DEFAULT 24 __data_start 81: 0000000000000000 0 NOTYPE WEAK DEFAULT UND _Jv_RegisterClasses 82: 0000000000000000 0 NOTYPE WEAK DEFAULT UND __gmon_start__ Histogram for bucket list length (total of 3 buckets): Length Number % of total Coverage 0 1 ( 33.3%) 1 0 ( 0.0%) 0.0% 2 2 ( 66.7%) 100.0% Version symbols section '.gnu.version' contains 5 entries: Addr: 0000000000400382 Offset: 0x000382 Link: 5 (.dynsym) 000: 0 (*local*) 2 (GLIBC_2.2.5) 2 (GLIBC_2.2.5) 0 (*local*) 004: 0 (*local*) Version needs section '.gnu.version_r' contains 1 entries: Addr: 0x0000000000400390 Offset: 0x000390 Link to section: 6 (.dynstr) 000000: Version: 1 File: libc.so.6 Cnt: 1 0x0010: Name: GLIBC_2.2.5 Flags: none Version: 2 Notes at offset 0x00000254 with length 0x00000020: Owner Data size Description GNU 0x00000010 NT_VERSION (version) Notes at offset 0x00000274 with length 0x00000018: Owner Data size Description SuSE 0x00000004 Unknown note type: (0x45537553)

　　正如从该输出中看到的，简单的 a.out Hello World 文件中包含了大量有价值的细节信息，包括版本信息、柱状图、各种符号类型的表格，等等。通过使用本文中介绍的这几种工具分析目标文件，您可以慢慢地对可执行程序进行研究。

　　除了所有这些段之外，编译器可以将调试信息放入到目标文件中，并且还可以显示这些信息。输入下面的命令，仔细分析编译器的输出（假设您扮演了调试程序的角色）：

　　readelf --debug-dump a.out | less
　　这个命令生成的输出如清单 5 所示。调试工具，如 GDB，可以读取这些调试信息，并且当程序在调试器中运行的同时，您可以使用该工具显示更具描述性的标记，而不是对代码进行反汇编时的原始地址值。

　　清单 5. 该程序中的调试信息

　　The section .debug_aranges contains: Length: 76 Version: 2 Offset into .debug_info: 8f Pointer Size: 8 Segment Size: 0 Address Length 004005e4 4 004003f8 9 0040046c 23 00000000 0 Length: 44 Version: 2 Offset into .debug_info: 10f Pointer Size: 8 Segment Size: 0 Address Length 004004f8 21 00000000 0 Length: 60 Version: 2 Offset into .debug_info: 20e Pointer Size: 8 Segment Size: 0 Address Length 004005ed 5 0040040b 5 00000000 0 Contents of the .debug_pubnames section: Length: 33 Version: 2 Offset into .debug_info section: 0 Size of area in .debug_info section: 143 Offset Name 115 _IO_stdin_used Length: 23 Version: 2 Offset into .debug_info section: 271 Size of area in .debug_info section: 255 Offset Name 220 main The section .debug_info contains: Compilation Unit @ offset 0x0: Length: 139 Version: 2 Abbrev Offset: 0 lines 1-56 　　

可执行文件是目标文件

　　在 UNIX 中，可执行文件是目标文件，并且您可以像对 a.out 文件那样对它们进行分析。可以进行一次有益的练习，更改到 /bin 或 /local/bin 目录，然后针对一些您最常用的命令，如 pwd、ps、cat 或 rm，运行 nm、objdump 和 readelf。通常，在您编写需要某种功能的程序时，如果标准的工具已经提供了这个功能，那么通过运行 objdump -d <command>，可以查看这些工具究竟如何完成这项任务。

　　如果您倾向于使用编译器和其他的语言工具，那么您可以对组成计算机系统的各种目标文件进行仔细研究，并且您将会发现这项工作是非常值得的。UNIX 操作系统具有许多层次，那些通过工具查看目标文件所公开的层次，非常接近底层硬件。通过这种方式，您可以真实地接触到系统。

结束语

　　研究目标文件可以极大地加深您对 UNIX 操作系统的认识，并且可以更深入地了解如何对软件的源代码进行汇编。我鼓励您使用本文中介绍的目标文件工具对系统中 /bin 或 /local/bin 目录中的程序进行分析，仔细研究其输出结果，并找出您的硬件制造商所提供的系统文档。