GCC中初始化函数是如何被处理的?

本文译至:

http://gcc.gnu.org/onlinedocs/gccint/Initialization.html

如我们所知,在GCC通过给代码追加__attribute__((constructor))和__attribute__((destructor))的方式可以追加初始函数和终止函数,

这篇文章介绍了GCC内部是如何实现上述处理的。

简单的说,就是在最经常的情况下,初始函数会被追加到.ctor section中,.init会调用对应的函数处理这些初始函数。终止情况类似。

----------------------------------------------------------

初始化函数是如何被处理的?

某些语言被编译后的代码包括构造体(也被称为初始化例程)-- 该函数被用于程序启动时初始化程序数据。这些函数需要在程序“开始”前被调用 - 就是说,在main函数被调用。
同时,编译一些语言时会生成析构体(也被称为终止例程),它应在程序结束时被调用。
为了支持初始函数和终止函数,编译器必须在汇编代码中生成一些东西来使这些函数在合适的时间点被调用。当你把编译器移植到一个新的系统时,你需要去指定怎么去做。
目前GCC主要有两种方式支持初始函数和终止函数的执行,每种方式都有两个变体。对这四种变体而言,大部分结构是共通的。
链接器必须为这些函数建立两个列表 --  一个初始化函数的列表,称为 __CTOR_LIST__,和一个终止函数列表,称为 __DTOR_LIST__。
每个列表总是从一个被忽略的函数指针开始(该函数指针在不同环境下,可能是0, -1 或是其后的函数指针的个数)。该函数指针后面跟随着一系列的0或是更多的构造体(析构体)函数指针,最后以一个包含0的函数指针结束。
依据不同OS和它的可执行文件格式,crtstuff.c 或 libgcc2.c 会在启动时和退出时遍历这些列表。构造体按列表的逆序被调用,析构体按顺序被调用。
处理静态构造体的最佳方式只支持提供任意命名Section的目标文件格式。一个Section被用于构造体列表,另一个用于析构体列表。它们习惯上被叫做‘.ctors’ 和 ‘.dtors’。每个定义一个初始函数的目标文件在构造体的section里放置一个word来指向初始函数。链接器累积所有的word到一个连续的‘.ctors’ section中。终止函数也按类似的方式处理。
如果 TARGET_ASM_NAMED_SECTION 被定义,这种方法会被 target-def.h 设为默认方式。如果一个目标板不支持任意命名的section,但是又支持特殊的可指定的构造体和析构体也可以通过定义 CTORS_SECTION_ASM_OP 和 DTORS_SECTION_ASM_OP 来达到同样的效果。
当支持任意命名的section时,根据crtstuff.c代码被调用的区别有两种变体。在支持.init section(在程序启动时执行)的系统上,crtstuff.c的部分内容会被编译到这个section里。程序像这样被链接:
     ld -o output_file crti.o crtbegin.o ... -lgcc crtend.o crtn.o
一个函数的prologue (__init) 出现在crti.o的 .init section 中 ;epilogue 出现在crtn.o中. 函数 __fini 在 .fini section的处理也一样. 正常情况下,这些文件由OS或GNU C库来提供,但是一些目标板是由GCC提供。
目标文件crtbegin.o 和crtend.o (大部分的情况下)
由crtstuff.c编译得到. 它们包含,除了别的以外,.init 和 .fini sections中的代码片段,用于跳转到 .text section中函数。链接器会将一个section的所有部分放在一起,来生成一个完整的__init函数来调用我们需要在启动阶段调用的函数。

为了使用这个变体,你必须正确的定义 INIT_SECTION_ASM_OP 宏。

如果init section不能使用,当GCC编译任何名为main的函数时(更精确点,任何被expand_main_function指定为程序入口点的函数),它在插入一个函数调用__main做为函数prologue后的第一段执行代码. __main 函数在 libgcc2.c 里被定义并执行全局的构造体。

不支持任意section的文件格式,同样也有两种变体。在最简单的变体里必须用到GNU 链接器(GNU ld)和'a.out' 格式。这种情况下,TARGET_ASM_CONSTRUCTOR 被定义来生成一个类型为'N_SETT'的.stabs入口,参照__CTOR_LIST__, .stabs入口把指向初始化函数代码的void函数地址做为它的值。GNU链接器认为这是一个把值加到集合的请求;这些值会累积,最终放在可执行文件里做为一个向量,格式如前所述,有一个前导(被忽略)的count和一个末尾的0元素。TARGET_ASM_DESTRUCTOR 处理也类似。既然没有init section可用,缺省的 INIT_SECTION_ASM_OP 使 main 的编译过程会去调用上述的__main函数,开始初始化处理。

最后的变体既不使用任意section也不用GNU 链接器。这在你想要动态链接且文件格式不被 GNU 链接器支持(如 ECOFF )的情况下推荐使用。在这种情况下,TARGET_HAVE_CTORS_DTORS 是错误的,初始和终止函数简单地通过它们的名称被识别。这个要求在链接阶段的使用一个叫 collect2 的额外程序。这个程序会假扮为链接器被 GCC 使用;它的工作是运行正常的链接器,也管理追加初始函数和终止函数的向量,这些函数通过上述的 __main 被调用。为了使用这个方法,必须在 config.gcc 里的 target 定义use_collect2。

### 初始化函数的作用 初始化函数的主要作用是对对象或数据结构进行必要的设置,使其处于可正常使用的状态。这通常涉及为变量分配初始值、配置资源(如文件句柄、网络连接)、或者准备运行时所需的其他条件。这种操作可以减少程序中的错误风险并提高代码的可维护性和清晰度。 在某些编程环境中,例如嵌入式开发中,初始化函数还可能涉及到硬件设备的状态设定以及特定内存区域的内容填充等复杂任务[^3]。 ### 实现方法概述 #### 方法一:通过宏定义与属性指定 一种常见的实现技术是利用编译器支持的功能来简化初始化逻辑。例如,在给定的例子中展示了如何借助 GCC 的 `__attribute__` 扩展特性将初始化回调放置到特殊的存储段 ("RAMCODE") 中以便稍后统一调用: ```c #define _init __attribute__((used, section("RAMCODE"))) #define MODULE_INIT(func) init_function_list _fn_##func _init = func; ``` 这里 `_init` 宏标记了一个特殊部分 (`section`) 下面的全局变量表项,它实际上指向某个具体的初始化例程 `func` 。这样做的好处在于可以在启动阶段集中处理所有此类标注过的函数指针数组。 #### 方法二:构造函数内的初始化列表(C++) 对于面向对象的语言像 C++ ,更推荐的方式是在类的设计阶段就考虑好实例创建时所需的一切准备工作,并将其融入到相应的构造过程中去完成这些工作。具体而言就是采用成员初始化列表的形式来进行高效且安全的对象构建: ```cpp class Example { public: int value; // 使用初始化列表 Example(int v) : value(v) {} }; // 或者更复杂的场景下 Example::Example(const std::string& strValue, double dVal) : stringValue(strValue), decimalValue(dVal) {} ``` 上述例子说明了即使存在多个字段也需要分别对待的情况也可以优雅地解决掉[^5]^。 #### 方法三:基于C语言的传统做法 如果仅限于标准C,则往往依赖手动编写专门用来做这件事儿的小型辅助工具——即所谓的“初始化子”。这类方案虽然简单直白但却容易遗忘重要环节或是忘记释放关联资源等问题发生;另外由于缺乏内置机制保护所以更容易引入潜在隐患比如重复初始化等等情况出现[^4]^。 下面给出一个简单的示范案例展示怎样正确运用这种方式: ```c typedef struct NodeStruct{ int data; }Node; void InitNode(Node* pNode){ if(!pNode)return ; memset(pNode,0,sizeof(*pNode)); } int main(){ Node n; InitNode(&n); } ``` 在这里可以看到我们先判断传进来是不是有效地址再继续往下走以防万一遇到非法输入造成崩溃事故的发生同时也清除了整个结构体内存单元确保没有任何垃圾残留影响后续正常使用体验良好^。 ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值