目录
编译过程
通常我们可以使用gcc来生成可执行程序,命令为:gcc test.c ,默认生成可执行文件a.out,其实编译(包括链接)的命令:gcc test.c可分解为以下四个步骤:
·预处理
·编译
·汇编
·链接
1.预处理
预处理是读取C源程序,对其中的伪指令(以#开头的指令,也就是宏)和特殊符号进行“替换”处理 ,生成一个没有宏定义、没有条件编译指令、没有特殊符号的输出文件。这个文件的含义同没有经过预处理的源文件是相同的,仍然是C文件,但内容有所不同。伪指令主要包括以下三个方面:
(1)宏定义指令,如#define Name TokenString,#undef以及编译器内建的一些宏,如_DATA_,_FILE_,_LINE_,_TIME_,_FUNCTION_等。
(2)条件编译指令,如#ifdef,#ifndef,#else,#elif,#endif等。
(3)头文件包含指令,如#include "FileName"或者#include<FileName>等。
预处理过程主要包括以下过程:
文件包含(File Inclusion):处理源代码中的#include
指令,将指定的文件内容插入到当前文件中。
宏替换(Macro Expansion):处理源代码中的宏定义,将宏名称替换为其对应的定义。
条件编译(Conditional Compilation):根据条件编译指令(如#ifdef
、#ifndef
、#if
等)判断哪些代码块需要包含在最终的编译结果中。
注释删除(Comment Removal):去除源代码中的注释内容。
行连接(Line Concatenation):将源代码中使用反斜杠\
标记的多行代码连接成单行。
空白删除(Whitespace Removal):去除源代码中的多余空格和制表符。
预处理指令处理(Preprocessor Directive Processing):处理其他预处理指令,如#define
、#undef
、#pragma
等。
生成预处理输出文件(Preprocessed Output Generation):将预处理后的源代码输出到文件供后续编译使用。
通常使用以下命令来进行预处理,参数-E表示只进行预处理:
gcc -E test.c -o test.i
也可以使用以下指令完成预处理过程,其中cpp是预处理器:
cpp test.c > test.i
2.编译
在这个阶段,编译器将预处理后的源代码(通常是C、C++、Objective-C等高级语言)编译成汇编代码(通常是特定CPU架构的汇编指令)。
使用以下命令:
gcc -S test.i > test.s
/opt/xtools/arm920t/bin/arm-linux-gcc -S test.i > test.s
使用PC编译器gcc就会生成x86的汇编,而使用ARM的编译器则生成ARM的汇编文件,同一份C代码不作任何修改,使用不同的编译器编译就生成在不同机器上运行的程序,这就是C程序的可移植性
3.汇编
在这个阶段,汇编器将汇编代码翻译成二进制机器码,生成目标文件。目标文件由段组成,通常一个目标文件中至少有两个段:
·代码段(文本段):该段中所包含的主要是程序的指令。该段一般是可读和可执行的,一般不写
·数据段:主要存放程序中要用的各种常量、全局变量、静态的数据。一般数据段都是可读,可写,可执行的;
命令:
gcc -c test.s -o test.o
4.链接
在这个阶段,链接器将多个目标文件以及可能的系统库、静态库等合并在一起,生成最终的可执行文件或共享库。
命令如下:
gcc test.o -o test -static