弱符号与强符号


《程序员的自我修养》弱符号与强符号


《程序员的自我修养:链接、装载与库》第3章目标文件里有什么。本章介绍COFF目标文件格式和源代码编译后如何在目标文件中存储。本节为大家介绍弱符号与强符号。

AD:

3.5.5  弱符号与强符号

我们经常在编程中碰到一种情况叫符号重复定义。多个目标文件中含有相同名字全局符号的定义,那么这些目标文件链接的时候将会出现符号重复定义的错误。比如我们在目标文件A和目标文件B都定义了一个全局整形变量global,并将它们都初始化,那么链接器将A和B进行链接时会报错:

b.o:(.data+0x0): multiple definition of `global'
a.o:(.data+0x0): first defined here
这种符号的定义可以被称为强符号(Strong Symbol)。有些符号的定义可以被称为弱符号(Weak Symbol)。对于C/C++语言来说,编译器默认函数和初始化了的全局变量为强符号,未初始化的全局变量为弱符号。我们也可以通过GCC的"__attribute__((weak))"来定义任何一个强符号为弱符号。注意,强符号和弱符号都是针对定义来说的,不是针对符号的引用。比如我们有下面这段程序:
extern int ext;
int weak;
int strong = 1;
__attribute__((weak)) weak2 = 2;
int main()
{
return 0;
}

上面这段程序中,"weak"和"weak2"是弱符号,"strong"和"main"是强符号,而"ext"既非强符号也非弱符号,因为它是一个外部变量的引用。针对强弱符号的概念,链接器就会按如下规则处理与选择被多次定义的全局符号:

规则1:不允许强符号被多次定义(即不同的目标文件中不能有同名的强符号);如果有多个强符号定义,则链接器报符号重复定义错误。

规则2:如果一个符号在某个目标文件中是强符号,在其他文件中都是弱符号,那么选择强符号。

规则3:如果一个符号在所有目标文件中都是弱符号,那么选择其中占用空间最大的一个。比如目标文件A定义全局变量global为int型,占4个字节;目标文件B定义global为double型,占8个字节,那么目标文件A和B链接后,符号global占8个字节(尽量不要使用多个不同类型的弱符号,否则容易导致很难发现的程序错误)。

弱引用和强引用  目前我们所看到的对外部目标文件的符号引用在目标文件被最终链接成可执行文件时,它们须要被正确决议,如果没有找到该符号的定义,链接器就会报符号未定义错误,这种被称为强引用(Strong Reference)。与之相对应还有一种弱引用(Weak Reference),在处理弱引用时,如果该符号有定义,则链接器将该符号的引用决议;如果该符号未被定义,则链接器对于该引用不报错。链接器处理强引用和弱引用的过程几乎一样,只是对于未定义的弱引用,链接器不认为它是一个错误。一般对于未定义的弱引用,链接器默认其为0,或者是一个特殊的值,以便于程序代码能够识别。弱引用和弱符号主要用于库的链接过程,我们将在"库"这一章再来详细讲述。弱符号跟链接器的COMMON块概念联系很紧密,我们在后面"深入静态链接"这一章中的"COMMON块"一节还会回顾弱符号的概念。

在GCC中,我们可以通过使用"__attribute__((weakref))"这个扩展关键字来声明对一个外部函数的引用为弱引用,比如下面这段代码:

__attribute__ ((weakref)) void foo();
int main()
{
foo();
}
我们可以将它编译成一个可执行文件,GCC并不会报链接错误。但是当我们运行这个可执行文件时,会发生运行错误。因为当main函数试图调用foo函数时,foo函数的地址为0,于是发生了非法地址访问的错误。一个改进的例子是:
__attribute__ ((weakref)) void foo();
int main()
{
if(foo) foo();
}

这种弱符号和弱引用对于库来说十分有用,比如库中定义的弱符号可以被用户定义的强符号所覆盖,从而使得程序可以使用自定义版本的库函数;或者程序可以对某些扩展功能模块的引用定义为弱引用,当我们将扩展模块与程序链接在一起时,功能模块就可以正常使用;如果我们去掉了某些功能模块,那么程序也可以正常链接,只是缺少了相应的功能,这使得程序的功能更加容易裁剪和组合。

在Linux程序的设计中,如果一个程序被设计成可以支持单线程或多线程的模式,就可以通过弱引用的方法来判断当前的程序是链接到了单线程的Glibc库还是多线程的Glibc库(是否在编译时有-lpthread选项),从而执行单线程版本的程序或多线程版本的程序。我们可以在程序中定义一个pthread_create函数的弱引用,然后程序在运行时动态判断是否链接到pthread库从而决定执行多线程版本还是单线程版本:

#include <stdio.h>
#include <pthread.h>
int pthread_create(
pthread_t*,
const pthread_attr_t*,
void* (*)(void*),
void*) __attribute__ ((weak));
int main()
{
if(pthread_create) {
printf("This is multi-thread version!\n");
// run the multi-thread version
// main_multi_thread()
} else {
printf("This is single-thread version!\n");   
// run the single-thread version
// main_single_thread()
}
}
编译运行结果如下:
$ gcc pthread.c -o pt
$ ./pt
This is single-thread version!
$ gcc pthread.c -lpthread -o pt
$ ./pt
This is multi-thread version!


### 符号符号定义 在 C/C++ 编程中,**符号(Strong Symbol)** **符号(Weak Symbol)** 是链接器处理符号时的概念。通常,函数已初始化的全局变量被视为符号,而未初始化的全局变量则被视为符号[^1]。例如: ```c int strong = 1; // 符号 int weak; // 符号 ``` 通过使用 `__attribute__((weak))`,可以将原本是符号符号显式标记为符号。这允许在同一程序中存在多个相同名称的定义,而不会导致链接错误。 --- ### 如何区分符号符号 在实际编程中,可以通过以下方式区分符号符号: - **查看源代码中的定义**:如果一个函数或变量被声明为 `__attribute__((weak))`,那么它是一个符号。 - **使用工具检查符号表**:通过运行 `nm` 工具并带有 `-g` 参数,可以列出当前目标文件或库中的所有符号,并识别哪些是符号、哪些是符号。例如: ```bash nm -g my_program.o ``` 输出可能类似于: ``` 0000000000000000 T _InitCocoaFW 0000000000000000 W _addNumbers ``` 其中,`T` 表示符号,`W` 表示符号[^2]。 --- ### 使用 `__weak` 关键字的注意事项 在使用 `__weak` 或等效的 `__attribute__((weak))` 时,需要注意以下几点: 1. **编译器兼容性**:并非所有编译器都支持 `__weak`。例如,在 GCC Clang 中可以使用 `__attribute__((weak))`,而在 MSVC 中没有直接对应的关键字。为了提高可移植性,可以使用宏定义来抽象这一差异: ```c #ifdef _WIN32 #define WEAK #else #define WEAK __attribute__((weak)) #endif void WEAK greet(void) { printf("Hello from default implementation!\n"); } ``` 2. **确保一致性**:如果多个源文件中定义了相同的函数,则应确保它们都被声明为符号,以避免链接错误。否则,链接器会报告多重定义错误。 3. **优先选择符号**:当一个符号同时存在定义定义时,链接器会选择定义。这意味着,即使提供了多个定义,最终只会有一个生效;如果有至少一个定义,则定义将被忽略[^1]。 4. **调试验证**:在开发过程中,建议使用 `nm` 工具检查生成的目标文件,确认预期的符号是否确实被标记为符号。 --- ### 示例代码 以下是一个简单的示例,展示如何使用 `__weak` 来避免函数重复定义错误: ```c #include <stdio.h> // 符号定义 void __attribute__((weak)) greet(void) { printf("Hello from default implementation!\n"); } int main() { greet(); // 调用可能被覆盖的符号函数 return 0; } ``` 在另一个源文件中,你可以提供一个定义来覆盖默认实现: ```c #include <stdio.h> // 符号定义 void greet(void) { printf("Hello from custom implementation!\n"); } ``` 通过这种方式,即使存在多个 `greet()` 函数定义,只要有一个是符号,就不会触发链接错误。 --- ### 相关问题 1. 在何种情况下应该使用符号而不是静态函数? 2. 不同编译器符号的支持有何差异? 3. 如何检测某个函数是否已经被声明为符号
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值