C++从代码到可执行程序

原创已于 2024-09-23 16:11:58 修改 · 1.2k 阅读

17 ·

CC 4.0 BY-SA版权

文章标签：

#c++ #开发语言

于 2024-09-23 14:53:13 首次发布

C++语法专栏收录该内容

8 篇文章

订阅专栏

C++从源代码到最终的可执行程序，经历了几个主要的步骤，包括预处理、编译、汇编和链接。这些步骤将高层的C++源代码逐步转换为机器可以执行的二进制指令。下面我将详细解释这些步骤及其过程。

源代码 (.cpp)   
      ↓ 
预处理 (Preprocessing)
      ↓
预处理后的源代码 (.i)
      ↓
编译 (Compilation)
      ↓
汇编代码 (.s)
      ↓
汇编 (Assembly)
      ↓
目标文件 (.o)
      ↓
链接 (Linking)
      ↓
可执行文件 (Executable)

预处理（Preprocessing）

预处理是编译的第一步，处理所有以#开头的指令（预处理指令，例如#include、#define、#if等）。预处理器的任务是展开宏、处理条件编译指令、替换文件的内容等。

主要工作：

宏替换：用#define定义的宏会在此阶段替换。
文件包含：#include指令会将头文件的内容插入到源文件中。
条件编译：处理#if、#ifdef、#endif等指令，根据条件选择性地编译部分代码。

输出：预处理的输出是一个纯文本文件（通常扩展名为.i或.ii），其中包含展开的宏和头文件。

编译（Compilation）

编译器将预处理后的源文件转换为汇编代码。编译器会进行语法分析、语义检查、优化等操作。

主要工作：

词法分析和语法分析：编译器首先会分析源代码的语法，确保代码符合C++的语法规则。这个过程会生成抽象语法树（AST），这是源代码的结构化表示。
语义检查：编译器会检查代码是否存在类型错误、未定义的变量或函数等语义问题。
优化：编译器可以进行一些基本的代码优化，比如删除死代码、简化表达式、函数内联等，以提高程序的执行效率。
生成汇编代码：编译器根据分析结果生成对应的汇编代码（扩展名通常为.s或.asm）。

输出：汇编代码是与目标平台相关的低级指令，它是比C++更接近机器语言的一种表示。

汇编（Assembly）

汇编器将汇编代码转换为机器指令，这些指令是计算机可以直接执行的二进制码。这个过程将文本形式的汇编指令转换为对应的二进制机器码。

主要工作：

机器码生成：将汇编指令逐行转换为机器指令，通常是每条汇编指令对应一条机器指令。
生成目标文件：生成的机器代码被存储在目标文件中（扩展名通常为.o或.obj）。目标文件中包含二进制代码以及一些必要的元数据，如符号表和重定位信息。

输出：汇编阶段生成的输出是目标文件，它包含了二进制形式的代码，但这些代码并不是完整的程序，不能直接执行。

链接（Linking）

链接器将多个目标文件以及依赖的库链接成一个完整的可执行文件。在C++项目中，通常会有多个源文件，它们各自生成目标文件，然后通过链接器合并成一个最终的可执行程序。

主要工作：

符号解析：链接器会解析每个目标文件中的符号（例如函数和变量），并找到它们在不同目标文件之间的定义和引用。比如，如果一个目标文件调用了另一个文件中的函数，链接器需要将这个调用与正确的函数实现链接在一起。
重定位：链接器将目标文件中的地址调整到可执行文件中的合适位置。
库的合并：如果程序使用了静态库（例如.lib或.a文件），链接器会将这些库的代码复制到最终的可执行文件中。如果使用了动态库（例如.dll或.so文件），则只是在可执行文件中记录动态库的路径。

输出：最终输出是一个可执行文件，它可以直接运行在目标平台上。

静态链接和动态链接是程序在链接阶段如何处理库文件的两种方式。在C++中，库（例如标准库、第三方库）通常提供了程序所需的函数、类或其他定义，而链接阶段负责将这些库与程序的其他部分连接起来。静态链接和动态链接各有优缺点，具体取决于程序的需求和运行环境。

静态链接意味着这个库会被放到你的可执行文件中（它在你的exe文件内部，或者其它操作系统下的可执行文件内）。
动态链接库是在运行时被链接的，所以你仍有一些链接，你可以选择在程序运行时装载动态链接库，有一个叫loadLibrary的函数，你可以在WindowsAPI中使用它作为例子。它会载入你的动态库，可以从中拉出函数然后开始调用。你也可以在应用程序启动时加载你的dll文件，这就是你的Dynamic Link Library（动态链接库）。

静态连接

静态链接意味着这个库会被放到你的可执行文件中（它在你的exe文件内部，或者其它操作系统下的可执行文件内）。

静态链接的过程：

在编译和链接阶段，静态库文件（通常扩展名为.lib或.a）被直接嵌入到生成的可执行文件中。
链接器将所有依赖的库代码整合到可执行文件中，生成一个独立的、可直接运行的程序。
优点：
独立性：静态链接生成的可执行文件包含所有需要的代码，无需依赖外部库，因此在没有外部依赖的情况下可以独立运行。
简单的部署：因为所有的代码都在一个文件中，部署时只需要分发这个单一的可执行文件，不需要额外的库文件。
运行时开销低：因为所有的代码都已经链接到了可执行文件中，运行时不需要加载额外的库文件，程序启动更快。
缺点：
文件较大：由于库的代码被直接嵌入到可执行文件中，可执行文件的体积会增加，尤其是当使用大量库时。
难以更新：如果库中的代码需要更新，必须重新编译整个程序来包含新的库版本。不能像动态链接那样只更新库文件即可。
内存浪费：如果多个程序使用同一个静态库，它们会各自包含一份该库的拷贝，导致内存和磁盘空间的浪费。

动态链接

动态链接发生在runtime（运行时），而静态链接是在编译时发生的。
当你编译一个静态库的时候，将其链接到可执行文件，也就是应用程序，或者链接到一个动态库。就像你取出了那个静态库的内容，然后你把那些内容放入到其它的二进制数据中，实际在你的动态库中或者在你的可执行文件中，有很大的优化空间。
动态链接是一种在运行时将库文件加载到内存中的方式（而静态链接是在编译时发生的。）。这意味着生成的可执行文件并不包含库的代码，而是引用外部的共享库文件。动态链接库通常有两种形式：动态链接库（DLL，Windows）和共享库（.so，Linux/Unix）。

动态链接的过程：
在链接阶段，生成的可执行文件不包含库代码，而是包含对库的引用信息（例如函数的地址）。
在程序运行时，操作系统负责将所需的动态库加载到内存，并将它们链接到程序中。
优点：