GCC编译器背后的故事

本文介绍了GCC编译器的详细过程,包括预处理、编译、汇编和链接四个阶段,以及ELF文件的段和反汇编。GCC不仅支持C语言,还支持多种其他语言,并广泛应用于各种平台。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

简介:

GCC 的意思也只是 GNU C Compiler 而已。经过了这么多年的发展,GCC 已经不仅仅能支持 C 语言;它现在还支持 Ada 语言、C++ 语言、Java 语言、Objective C 语言、Pascal 语言、COBOL 语言,以及支持函数式编程和逻辑编程的 Mercury 语言,等等。而 GCC 也不再单只是 GNU C 语 言编译器的意思了,而是变成了 GNU Compiler Collection 也即是 GNU 编译器家族的意思了。另 一方面,说到 GCC 对于操作系统平台及硬件平台支持,概括起来就是一句话:无所不在。

一、编译

//hello.c 
#include <stdio.h> 
int main(void)
 { 
 printf("Hello World!\n");
 return 0; 
 }

这个程序,一步到位的编译指令是:

gcc hehe.c -o test

实质上,上述编译过程是分为四个阶段进行的,即预处理(也称预编译,Preprocessing)、编译 (Compilation)、汇编 (Assembly)和连接(Linking)。

1. 预处理(Preprocessing)

预处理的过程主要包括以下过程:
(1) 将所有的#define 删,并且展开所有的宏定义,并且处理所有的条件预编译指令,比如#if ;#ifdef ; #elif ; #else; #endif 等。
(2) 处理#include 预编译指令,将被包含的文件插入到该预编译指令的位置。
(3) 删除所有注释“//”和“/* */”。
(4) 添加行号和文件标识,以便编译时产生调试用的行号及编译错误警告行号。
(5) 保留所有的#pragma 编译器指令,后续编译过程需要使用它们。 使用 gcc 进行预处理的命令如下:

gcc -E hello.c -o hello.i 

hello.i文件片段:
在这里插入图片描述

2.编译(Compilation)

编译过程就是对预处理完的文件进行一系列的词法分析,语法分析,语义分析及优化后生成相应的汇编代码。
注意:-S中的S要大写,不然会出错。)

gcc -S hello.i -o hello.s

hello.s文件片段:
在这里插入图片描述

3.汇编(Assembly)

汇编过程调用对汇编代码进行处理,生成处理器能识别的指令,保存在后缀为.o 的目标文件中。每一个汇编语句几乎都对应一条处理器指令。
使用 gcc 进行汇编的命令如下:

gcc -c hello.s -o hello.o

注意:hello.o 目标文件为 ELF(Executable and Linkable Format)格式的可重定向文件。

4.链接(Linking)

链接也分为静态链接和动态链接,其要点如下:
(1) 静态链接是指在编译阶段直接把静态库加入到可执行文件中去。
(2) 动态链接则是指链接阶段仅仅只加入一些描述信息,而程序执行时再从系统中把相应动态库加载到内存中去。

动态库链接:

gcc hello.c -o hello 
size hello //使用 size 查看大小

结果如图:
在这里插入图片描述
看该可执行文件链接了很多其他动态库

ldd hello

结果如图:
在这里插入图片描述
静态库链接:

gcc -static hello.c -o hello

同样观察大小和链接:

在这里插入图片描述

链接器链接后生成的最终文件为 ELF 格式可执行文件,一个 ELF 可执行文件通常被链接为不同的段。

二、分析 ELF 文件

1.ELF 文件的段

ELF 文件格式如下图所示,位于 ELF Header 和 Section Header Table 之间的都是段(Section)。一个典型的 ELF 文件包含下面几个段:
.text:已编译程序的指令代码段。
.rodata:ro 代表 read only,即只读数据。
.data:已初始化的 C 程序全局变量和静态局部变量。
.bss:未初始化的 C 程序全局变量和静态局部变量。 .debug:调试符号表,调试器用此段的信息帮助调试。

可以使用 readelf -S 查看其各个 section 的信息如下:

readelf -S hello

结果:
在这里插入图片描述

2.反汇编 ELF

由于 ELF 文件无法被当做普通文本文件打开,如果希望直接查看一个 ELF 文件包含的指令和数据,需要使用反汇编的方法。

代码如下():

objdump -D hello

执行结果:
在这里插入图片描述

使用 objdump -S 将其反汇编并且将其 C 语言源代码混合显示出来:

gcc -o hello -g hello.c //要加上-g 选项 
objdump -S hello

执行结果:
在这里插入图片描述

总结

学习了gcc的一些常用语句并对编译的过程有了更深的体会,不过ELF文件的理解还有待提高。
参考: lGCC 编译器背后的故事.

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值