gcc编译过程概述

本文详细介绍了GCC编译器的工作原理,包括预处理、编译、汇编和链接四个主要阶段,并通过一个简单的示例程序逐步展示了每个阶段的输出结果。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

    本文对gcc编译器如何工作做一个概要描述更为详细的信息请参考编译器手册。gcc编译器是GNU的一个编译套件。  

一、概要描述:

当我们进行编译的时候要使用一系列的工具我们称之为工具链其中包括预处理器CPP编译器前端gcc/g++汇编器as连接器ld(在Linux中都是文件一个编译过程包括下面几个阶段:

  (1)预处理预处理器CPP将对源文件中的宏进行展开,并在其中插入#include文件所包含的内容,预处理为.i文件

  (2)编译编译器前端gcc/g++将.i文件编译成汇编文件(.s)。 

  (3)汇编汇编器as将汇编文件编译成目标文件(.o)[机器码(二进制文件)]。 

  (4)连接器ld将目标文件和外部符号进行连接,得到一个可执行二进制文件(.out)

以上文件后缀为默认后缀,可以使用-o或>自定义文件名及后缀(建议自定义)。

编译过程与(2)编译强调的是不同的概念,不要将两个编译混淆。

二、例题解述:

    下面以一个很简单的test.c来探讨这个过程。

    #define NUMBER  (1+2)

    int main() 

   {      

       int x=NUMBER;       

       return 0;  

1)预处理:gcc会首先调用CPP进行预处理——CPP test.c >test.i

或者gcc -E test.c -o test.i(使用-E选项告诉GCC预处理后停止编译过程) 

预处理的输出为文件test.i。 我们用cat test.i查看test.i的内容如下:

    int main() 

   {  

      int x=(1+2);    

      return 0; 

    }  

    我们可以看到,文件中宏定义NUMBER出现的位置被(1+2)替换掉了,其它的内容保持不变。 

 

     (2)编译编译器前端gcc/g++将.i文件编译成汇编文件(.s)——gcc -S test.i

    得到的输出文件为test.s [注意:S大写,否则生成默认可执行文件a.out]

 

     (3)汇编汇编器as将汇编文件编译成目标文件(.o)——as test.s -o test.o 

    得到输出文件为test.o。(test.o中为目标机器上的二进制文件。)用nm查看文件中的符号——nm test.o

    输出如下:   

    00000000 b .bss  

    00000000 d .data     

    00000000 t .text   

    U ___main     

    U __alloca  

    00000000 T _main 

    既然已经是二进制目标文件了,能不能执行呢?试一下./test.o提示cannot execute binary file.原来___main前面的U表示这个符号的地址还没有定下来,T表示这个符号属于代码段。ld连接的时候会为这些带U的符号确定地址。

    注:(2)(3)指令相当于 gcc -x i-output -c test.i -o test.o

-x 选项告诉GCC从指定的步骤开始编译,-c 选项告诉GCC编译、汇编后停止编译过程。

 

    (4)连接器ld将目标文件和外部符号进行连接,得到一个可执行二进制文件(.out)——gcc test.o>test

     链接需要指定库的位置。通常程序中会有很多的外部符号,因此需要指定的位置就会很多。不过,我们需要调用gcc即可,ld会自己去找这些库的位置——gcc test.o>test就得到了最终的可执行程序了。

    注:gcc test.o -o test 仅表示将目标文件链接生成可执行文件;

        gcc test.c -o test 表示经过整个编译过程后生成可执行文件

       (test.c是指真正意义上的c源文件,非用户自定义的后缀名为.c的其他属性的文件。)

三、综述:

万幸的是上述四步可由——gcc filemane -o outputfilename 语句执行完成。如下:

   CPP test.c >test.i + gcc -S test.i + as test.s >test.o + gcc test.o >test = gcc test.c -o test   (最后的可执行程序名自定义为test,不会默认生成a.out,自定义时文件名及后缀都由自己定。)['>'与'-o'效果一样]。

    最后输入./test(不能有空格) 运行该可执行文件。

四、流程图

### GCC 编译过程概述 GCC 是 GNU Compiler Collection 的缩写,最初作为 GNU C Compiler 开发,后来扩展支持多种编程语言。通过 GCC 将源代码转换为可执行文件的过程中涉及多个阶段,这些阶段分别是预处理、编译汇编和链接。 --- #### 一、预处理 (Preprocessing) 预处理是 GCC 编译的第一步,在此过程中会解析所有的宏定义 (`#define`) 和头文件包含 (`#include`) 指令。预处理器会替换掉所有的宏并展开头文件的内容到源代码中,最终生成一个新的 `.i` 文件。 例如,对于 `main.c` 文件,可以通过以下命令完成预处理: ```bash $ gcc -E main.c -o main.i ``` 在此阶段,原始的 C 源代码被转化为一个不包含任何宏或头文件引用的纯文本文件[^1]。 --- #### 二、编译 (Compilation)编译阶段,经过预处理后的 `.i` 文件会被翻译成低级的汇编语言代码。这一阶段的主要工作是由高级语言(如 C 或 C++)向机器特定的汇编语言转化。 使用 `-S` 参数可以让 GCC 停留在该阶段,并输出对应的汇编代码文件 `.s`。例如: ```bash $ gcc -S main.i -o main.s ``` 此时生成的 `main.s` 文件包含了与目标架构相关的汇编指令[^4]。 --- #### 三、汇编 (Assembly) 汇编阶段的任务是将上一步生成的汇编代码文件 `.s` 转化为目标文件 `.o`。目标文件是一种二进制形式的数据结构,其中包含了机器码以及一些辅助信息以便后续链接操作。 可以单独运行汇编器来实现这一步骤: ```bash $ as main.s -o main.o ``` 或者直接让 GCC 完成整个流程的一部分: ```bash $ gcc -c main.s -o main.o ``` 在这个阶段,每一段独立的目标模块都已经被创建出来,但尚未形成完整的程序[^3]。 --- #### 四、链接 (Linking) 最后一步是链接阶段,它负责把之前产生的各个目标文件连接起来成为一个单一的应用程序。此外,如果项目依赖外部库,则也需要在这一步引入相应的静态或动态链接库。 假设存在两个目标文件 `file1.o` 和 `file2.o`,那么可以通过下面的方式进行链接: ```bash $ gcc file1.o file2.o -o final_program ``` 当涉及到标准函数调用时(比如 `printf()`),还需要从系统的标准库中提取必要的部分加入到最终产物之中[^2]。 --- ### 总结 综上所述,利用 GCC 工具链构建应用程序是一个多步骤的过程,依次经历了 **预处理** -> **编译** -> **汇编** -> **链接** 这些重要环节。每一个阶段都有其独特的职责范围和技术细节值得深入探讨。 ---
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值