编译和链接

原创已于 2025-06-08 12:29:43 修改 · 715 阅读

24 ·

CC 4.0 BY-SA版权

文章标签：

#c语言

于 2025-06-08 12:29:10 首次发布

翻译环境和运行环境

在C语言中，存在着两个不同的环境
翻译环境：C语言代码是文本文件，需要在翻译环境下进行翻译，将文本文件转换为计算机能够执行的二进制指令（也叫机器指令）
执行环境：该环境在计算机中，将二进制指令进行实际的执行

在这里插入图片描述

翻译环境

翻译环境是怎么将源代码转换为可执行的机器指令的呢？这里就更加详细的讲讲翻译环境
在这里插入图片描述

其实翻译环境是由编译和链接两个大的过程组成的，而编译又可以分解成：预处理（有些书也叫预编译）、编译、汇编三个过程。

在这里插入图片描述
⼀个C语言的项目中可能有多个 .c文件⼀起构建，那多个 .c文件如何生成可执行程序呢？

生成可执行程序的具体步骤如下:

• 多个.c文件单独经过编译器，编译处理⽣成对应的目标文件。
• 注：在Windows环境下的目标文件的后缀是 .obj ，Linux环境下目标文件的后缀是 .o
• 多个⽬标文件和链接库⼀起经过链接器处理生成最终的可执行程序。

• 链接库是指运⾏时的库或者第三⽅库。这个链接库是⽀持程序运⾏的基本函数集合（比如调用printf函数的标准库）

在这里插入图片描述

以下是更加具体的流程图，以便我们更加详细的了解其过程：
在这里插入图片描述
我们知道了大概的过程，如果我想要知道这些过程大概做了些什么事呢，请看下面的内容：
注意：以下内容的测试，我们使用的是Linux环境下的gcc编译器，这里我们使用vscode远程链接到Linux服务器上操作;
为什么不使用VS2022呢？
因为VS是一个IDE（集成开发环境）它会将编译链接这些细节进行封装起来了，你看不到

编译

预处理(预编译)

在预处理阶段，源文和头文件会被处理成为 .i 为后缀的文件。
在gcc环境下，想要观察对test.c 文件预处理后的.i文件，有如下命令：

gcc -E test.c -o test.i

-E :通过预处理过程后就停止，不在进行下一步操作； -o ：将test.c 文件的内容处理后输入到test.i文件中
预处理主要干的事：处理源文件中#开始的预编译指令
处理的规则如下：

将所有的 #define 删除，并展开所有的宏定义。(展开宏定义：#define定义的内容在预处理时进行文本替换)
• 处理所有的条件编译指令，如： #if、#ifdef、#elif、#else、#endif 。(后面会详细讲)
• 处理#include 预编译指令，将包含的头⽂件的内容插⼊到该预编译指令的位置。这个过程是递归进⾏的，也就是说被包含的头⽂件也可能包含其他⽂件。
• 删除所有的注释
• 添加⾏号和⽂件名标识，⽅便后续编译器⽣成调试信息等。
• 或保留所有的#pragma的编译器指令，编译器后续会使⽤。

经过预处理后的 .i 文件中不再包含宏定义，因为宏已经被展开。并且包含的头文件的内容都被插入到 .i文件中。
如果我们不知道宏定义或者头⽂件是否包含正确的时候，可以查看预处理后的 .i ⽂件进行确认。
在这里插入图片描述
预处理处理的是文本文件，将它进行复制删除等等

编译

编译过程就是将预处理后的⽂件进行一系列的：词法分析、语法分析、语义分析及优化，生成相应的汇编代码文件。

编译过程中使用的命令：

gcc -S test.i -o test.s

举个实例，对三个分析进行解释

array[index] = (index+4)*(2+6);

词法分析

将源代码程序被输⼊扫描器，扫描器的任务就是简单的进行词法分析，把代码中的字符分割成一系列的记号（关键字、标识符、字面量、特殊字符等）。

在这里插入图片描述

语法分析

接下来语法分析器，将对扫描产生的记号进行语法分析，从而产⽣语法树。这些语法树是以表达式为节点的树。

在这里插入图片描述

语义分析

由语义分析器来完成语义分析，即对表达式的语法层面分析。编译器所能做的分析是语义的静态分析。静态语义分析通常包括声明和类型的匹配，类型的转换等。这个阶段会报告错误的语法信息。

在这里插入图片描述

汇编

将汇编代码转换为(或二进制指令)机器可执行的指令，各个汇编文件单独生成对应的目标文件，各自单独产生一个符号表
汇编的命令如下：

gcc -c test.s -o test.o

举个例子:
文件Add.c

#define _CRT_SECURE_NO_WARNINGS 
int Add(int x, int y)
{
	return x + y;
}

文件test.c

#define _CRT_SECURE_NO_WARNINGS 
#include<stdio.h>

int main()
{
	int a = 100;
	int b = 225;
	int ret = Add(a, b);
	printf("%d\n", ret);
	return 0;
}

将.s为后缀的文件各自翻译成二进制文件test.o 和Add.o和链接库生成各自的目标文件
同时自单独产生一个符号表
根据案例做出的示意图，以便更好地理解
在这里插入图片描述

链接

链接要干的事情：将地址和空间分配，同时也将符号表进行合并和重定位
重定位：将前面文件中的Add有无效的地址修正到最后符号表合并后的地址的过程叫重定位
上图中的案例就是将符号表进行合并，生成.exe为后缀的文件

推荐《程序员的自我修养》⼀书讲的更加细节
上述的知识汇总图：

在这里插入图片描述

执行环境

程序必须载入内存中。在有操作系统的环境中：⼀般这个由操作系统完成。(比如Windows环境下，使用鼠标进行双击点开文件的过程)
在独立的环境中，程序的载入必须由手工安排，也可能是通过可执行代码置⼊只读内存来完成。（嵌入式的单片机没有操作系统，使用它的程序我们就必须用手焊板子来完成）
程序的执行便开始。接着便调用main函数。
开始执行程序代码。这个时候程序将使用⼀个运行时堆栈（stack），存储函数的局部变量和返回（运行时堆栈（stack）：进入了作用域，调用函数等操作，出了作用域自动销毁）地址。程序同时也可以使用静态（static）内存，存储于静态内存中的变量在程序的整个执行过程⼀直保留他们的值。
终止程序。正常终止main函数（代码运行结束）；也有可能是意外终止。（程序卡死等等）