GCC源码分析（一）——介绍与安装

最新推荐文章于 2025-02-18 11:25:59 发布

原创

最新推荐文章于 2025-02-18 11:25:59 发布 · 1.8w 阅读

42 ·

CC 4.0 BY-SA版权

文章标签：

#gcc #编译器 #translation #代码分析 #makefile #语言

本文介绍了GCC在Linux下的重要性及其运行机制，详细解析了编译过程中的词法分析、语法分析等步骤，强调GCC作为编译驱动器的角色，如何通过cc1、as和ld完成工作。同时，文章提供了GCC的安装步骤，包括依赖库的准备和源码编译过程。

上半年一直在做有关GCC和LD的项目，到现在还没做完。最近几天编程的那台电脑坏了，所以趁此间隙写一点相关的分析和经验之类的跟大家共享。

一、GCC的作用和运行机制

GCC是Linux下重要的编译工具，用法这里就不说了，满大街都找得到。这里我重点介绍GCC的运作机制，作为代码分析的铺垫。全篇使用C语言子部件来作分析，因为我对其他语言的编译没有研究。

根据编译原理，语言的编译分为这么几个步骤：词法分析、语法分析、语义分析、中间语言生成、优化、目标代码生成等。然而从编译器使用的角度来看，要把源代码翻译为可执行文件要经过编译和连接两步，与此对应，一个完整的编译系统一定包含编译器和连接器两大功能部件。编译器要完成编译原理中提到的那些任务；连接器要把编译器生成的代码片段拼接成一个完整的可执行程序。之所以需要连接器，是因为一般的程序都是多源文件的，而编译器一次只编译一个源文件（称之为翻译单元translation unit），因此需要连接器把所有翻译单元对应的输出合并成一个可执行文件。

如果一切顺利，可执行程序就可以正确的生成出来。但是一旦源代码存在某些问题，错误就会被报告出来。编译器报告的错误一般都是局部错误，它会指明错误在哪个文件第几行；连接器报告的错误一般都是全局错误，而且绝大多数都是多胳膊少腿的问题，比如函数重定义，无法解决的外部符号等，这些错误无法定位到某一行。

GCC就是这里的编译器。准确来说，GCC是一个编译驱动器，驱动cc1、as和ld三个部件完成编译、汇编和连接的工作。cc1将C语言源文件编译为汇编文件（.s）。而将汇编代码转换为二进制指令的工作由AS完成，生成大家都很熟悉的对象文件（.o）；生成的这些对象文件再由AR程序打包成静态库（.a），或者由LD程序连接成可执行程序（elf、.so或其他格式）。而LD就是所谓的连接器。AS、AR、LD是属于另外一个叫做binutils的软件包的程序，所以要让GCC能够有效运作起来，除了在系统中安装GCC外，还要安装binutils才行。

以下是cc1、as、ld各司其责的配合完成