翻译环境和运行环境
在C语言中,存在着两个不同的环境
翻译环境:C语言代码是文本文件,需要在翻译环境下进行翻译,将文本文件转换为计算机能够执行的二进制指令(也叫机器指令)
执行环境:该环境在计算机中,将二进制指令进行实际的执行

翻译环境
翻译环境是怎么将源代码转换为可执行的机器指令的呢?这里就更加详细的讲讲翻译环境

其实翻译环境是由编译和链接两个大的过程组成的,而编译又可以分解成:预处理(有些书也叫预编译)、编译、汇编三个过程。

⼀个C语言的项目中可能有多个 .c文件⼀起构建,那多个 .c文件如何生成可执行程序呢?
生成可执行程序的具体步骤如下:
• 多个.c文件单独经过编译器,编译处理⽣成对应的目标文件。
• 注:在Windows环境下的目标文件的后缀是 .obj ,Linux环境下目标文件的后缀是 .o
• 多个⽬标文件和链接库⼀起经过链接器处理生成最终的可执行程序。
• 链接库是指运⾏时的库或者第三⽅库。这个链接库是⽀持程序运⾏的基本函数集合(比如调用printf函数的标准库)

以下是更加具体的流程图,以便我们更加详细的了解其过程:

我们知道了大概的过程,如果我想要知道这些过程大概做了些什么事呢,请看下面的内容:
注意:以下内容的测试,我们使用的是Linux环境下的gcc编译器,这里我们使用vscode远程链接到Linux服务器上操作;
为什么不使用VS2022呢?
因为VS是一个IDE(集成开发环境)它会将编译链接这些细节进行封装起来了,你看不到
编译
预处理(预编译)
在预处理阶段,源文和头文件会被处理成为 .i 为后缀的文件。
在gcc环境下,想要观察对test.c 文件预处理后的.i文件,有如下命令:
gcc -E test.c -o test.i
-E :通过预处理过程后就停止,不在进行下一步操作; -o :将test.c 文件的内容处理后输入到test.i文件中
预处理主要干的事:处理源文件中#开始的预编译指令
处理的规则如下:
将所有的 #define 删除,并展开所有的宏定义。(展开宏定义:#define定义的内容在预处理时进行文本替换)
• 处理所有的条件编译指令,如: #if、#ifdef、#elif、#else、#endif 。(后面会详细讲)
• 处理#include 预编译指令,将包含的头⽂件的内容插⼊到该预编译指令的位置。这个过程是递归进⾏的,也就是说被包含的头⽂件也可能包含其他⽂件。
• 删除所有的注释
• 添加⾏号和⽂件名标识,⽅便后续编译器⽣成调试信息等。
• 或保留所有的#pragma的编译器指令,编译器后续会使⽤。
经过预处理后的 .i 文件中不再包含宏定义,因为宏已经被展开。并且包含的头文件的内容都被插入到 .i文件中。
如果我们不知道宏定义或者头⽂件是否包含正确的时候,可以查看预处理后的 .i ⽂件进行确认。

预处理处理的是文本文件,将它进行复制删除等等
编译
编译过程就是将预处理后的⽂件进行一系列的:词法分析、语法分析、语义分析及优化,生成相应的汇编代码文件。
编译过程中使用的命令:
gcc -S test.i -o test.s
举个实例,对三个分析进行解释
array[index] = (index+4)*(2+6);
词法分析
将源代码程序被输⼊扫描器,扫描器的任务就是简单的进行词法分析,把代码中的字符分割成一系列的记号(关键字、标识符、字面量、特殊字符等)。

语法分析
接下来语法分析器,将对扫描产生的记号进行语法分析,从而产⽣语法树。这些语法树是以表达式为节点的树。

语义分析
由语义分析器来完成语义分析,即对表达式的语法层面分析。编译器所能做的分析是语义的静态分析。静态语义分析通常包括声明和类型的匹配,类型的转换等。这个阶段会报告错误的语法信息。

汇编
将汇编代码转换为(或二进制指令)机器可执行的指令,各个汇编文件单独生成对应的目标文件,各自单独产生一个符号表
汇编的命令如下:
gcc -c test.s -o test.o
举个例子:
文件Add.c
#define _CRT_SECURE_NO_WARNINGS
int Add(int x, int y)
{
return x + y;
}
文件test.c
#define _CRT_SECURE_NO_WARNINGS
#include<stdio.h>
int main()
{
int a = 100;
int b = 225;
int ret = Add(a, b);
printf("%d\n", ret);
return 0;
}
将.s为后缀的文件各自翻译成二进制文件test.o 和Add.o和链接库生成各自的目标文件
同时自单独产生一个符号表
根据案例做出的示意图,以便更好地理解

链接
链接要干的事情:将地址和空间分配,同时也将符号表进行合并和重定位
重定位:将前面文件中的Add有无效的地址修正到最后符号表合并后的地址的过程叫重定位
上图中的案例就是将符号表进行合并,生成.exe为后缀的文件
推荐《程序员的自我修养》⼀书讲的更加细节
上述的知识汇总图:

执行环境
- 程序必须载入内存中。在有操作系统的环境中:⼀般这个由操作系统完成。(比如Windows环境下,使用鼠标进行双击点开文件的过程)
在独立的环境中,程序的载入必须由手工安排,也可能是通过可执行代码置⼊只读内存来完成。(嵌入式的单片机没有操作系统,使用它的程序我们就必须用手焊板子来完成) - 程序的执行便开始。接着便调用main函数。
- 开始执行程序代码。这个时候程序将使用⼀个运行时堆栈(stack),存储函数的局部变量和返回(运行时堆栈(stack):进入了作用域,调用函数等操作,出了作用域自动销毁)地址。程序同时也可以使用静态(static)内存,存储于静态内存中的变量在程序的整个执行过程⼀直保留他们的值。
- 终止程序。正常终止main函数(代码运行结束);也有可能是意外终止。(程序卡死等等)
8754

被折叠的 条评论
为什么被折叠?



