gcc编译过程

GCC编译流程解析
本文详细介绍了GCC编译器的工作原理,包括预处理、编译、汇编和连接四个主要阶段,并通过一个简单的示例程序逐步说明每个阶段的输出。

本文对gcc编译器如何工作做一个概要描述.更为详细的信息请参考编译器手册。

当我们进行编译的时候,要使用一系列的工具,我们称之为工具链.其中包括:预处理器CPP,编译器前端gcc/g++,汇编器as,连接器ld.一个编译过程包括下面几个阶段:
(1)预处理。预处理器CPP将对源文件中的宏进行展开。
(2)编译。gcc将c文件编译成汇编文件。
(3)汇编。as将汇编文件编译成机器码。
(4)连接。ld将目标文件和外部符号进行连接,得到一个可执行二进制文件。

下面以一个很简单的test.c来探讨这个过程。
#defineNUMBER(1+2)
int main()
{
int x = NUMBER;
return 0;
}

(1)预处理:
gcc会首先调用CPP进行预处理:CPP test.c > test.i
预处理的输出为文件test.i。
我们用cat test.i查看test.i的内容如下:
int main()
{
int x = (1+2);
return 0;
}
我们可以看到,文件中宏定义NUMBER出现的位置被(1+2)替换掉了,其它的内容保持不变。

(2)gcc将c文件编译成汇编文件。
接下来gcc会执行gcc -S test.i得到的输出文件为test.s.

(3)as将汇编文件编译成机器码。
as test.s -o test.o
得到输出文件为test.o.
test.o中为目标机器上的二进制文件.
用nm查看文件中的符号:nm test.o
输出如下:
00000000 b .bss
00000000 d .data
00000000 t .text
U ___main
U __alloca
00000000 T _main

既然已经是二进制目标文件了,能不能执行呢?试一下./test.o,提示cannot execute binaryfile.
原来___main前面的U表示这个符号的地址还没有定下来,T表示这个符号属于代码段。ld连接的时候会为这些带U的符号确定地址。

(4)连接。
连接需要指定库的位置。通常程序中会有很多的外部符号,因此需要指定的位置就会很多。
不过,我们之需要调用gcc即可,ld会自己去找这些库的位置。
gcc test.o > test
就得到了最终的可执行程序了。

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值