c++模板分离式编译时无法解析外部符号

转自:http://blog.youkuaiyun.com/bichenggui/article/details/4207084


首先,一个编译单元(translation unit)是指一个.cpp文件以及它所#include的所有.h文件,.h文件里的代码将会被扩展到包含它的.cpp文件里,然后编译器编译该.cpp文件为一个.obj文件(假定我们的平台是win32), 后者拥有PE(Portable Executable,即windows可执行文件)文件格式,并且本身包含的就已经是二进制码,但是不一定能够执行,因为并不保证其中一定有main函数。当编译器将一个工程里的所有.cpp文件以分离的方式编译完毕后,再由连接器(linker)进行连接成为一个.exe文件。

//---------------test.h-------------------//
void f();//这里声明一个函数f
 
//---------------test.cpp--------------//
#include”test.h”
void f()
{
…//do something
} //这里实现出test.h中声明的f函数

//---------------main.cpp--------------//
#include”test.h”
int main()
{
f(); //调用f,f具有外部连接类型
}

在这个例子中,test. cpp和main.cpp各自被编译成不同的.obj文件(姑且命名为test.obj和main.obj),在main.cpp中,调用了f函数,然而 当编译器编译main.cpp时,它所仅仅知道的只是main.cpp中所包含的test.h文件中的一个关于void f();的声明,所以,编译器将这里的f看作外部连接类型,即认为它的函数实现代码在另一个.obj文件中,本例也就是test.obj,也就是说,main.obj中实际没有关于f函数的哪怕一行二进制代码,而这些代码实际存在于test.cpp所编译成的test.obj中。在main.obj中对f的调用只会生成一行call指令,像这样:

call f [C++中这个名字当然是经过mangling[处理]过的]

在编译时,这个call指令显然是错误的,因为main.obj中并无一行f的实现代码。那怎么办呢?这就是连接器的任务,连接器负责在其它 的.obj中(本例为test.obj)寻找f的实现代码,找到以后将call f这个指令的调用地址换成实际的f的函数进入点地址。需要注意的是:连接器实际上将工程里的.obj“连接”成了一个.exe文件,而它最关键的任务就是 上面说的,寻找一个外部连接符号在另一个.obj中的地址,然后替换原来的“虚假”地址。

这个过程如果说的更深入就是:

call f这行指令其实并不是这样的,它实际上是所谓的stub,也就是一个jmp 0xABCDEF。这个地址可能是任意的,然而关键是这个地址上有一行指令来进行真正的call f动作。也就是说,这个.obj文件里面所有对f的调用都jmp向同一个地址,在后者那儿才真正”call”f。这样做的好处就是连接器修改地址时只要对 后者的call XXX地址作改动就行了。但是,连接器是如何找到f的实际地址的呢(在本例中这处于test.obj中),因为.obj与.exe的格式是一样的,在这样 的文件中有一个符号导入表和符号导出表(import table和export table)其中将所有符号和它们的地址关联起来。这样连接器只要在test.obj的符号导出表中寻找符号f(当然C++对f作了mangling)的 地址就行了,然后作一些偏移量处理后(因为是将两个.obj文件合并,当然地址会有一定的偏移,这个连接器清楚)写入main.obj中的符号导入表中f 所占有的那一项即可。

这就是大概的过程。其中关键就是:

编译main.cpp时,编译器不知道f的实现,所以当碰到对它的调用时只是给出一个指示,指示连接器应该为它寻找f的实现体。这也就是说main.obj中没有关于f的任何一行二进制代码。

编译test.cpp时,编译器找到了f的实现。于是乎f的实现(二进制代码)出现在test.obj里。

连接时,连接器在test.obj中找到f的实现代码(二进制)的地址(通过符号导出表)。然后将main.obj中悬而未决的call XXX地址改成f实际的地址。完成。

然而,对于模板,你知道,模板函数的代码其实并不能直接编译成二进制代码,其中要有一个“实例化”的过程。举个例子:

//----------main.cpp------//
template<class T>
void f(T t)
{}
int main()
{
…//do something
f(10); // call f<int> 编译器在这里决定给f一个f<int>的实例
…//do other thing
}

也就是说,如果你在main.cpp文件中没有调用过f,f也就得不到实例化,从而main.obj中也就没有关于f的任意一行二进制代码!如果你这样调用了:

f(10); // f<int>得以实例化出来

f(10.0); // f<double>得以实例化出来

这样main.obj中也就有了f<int>,f<double>两个函数的二进制代码段。以此类推。

然而实例化要求编译器知道模板的定义,不是吗?

看下面的例子(将模板的声明和实现分离)

//-------------test.h----------------//
template<class T>
class A
{
public:
void f(); // 这里只是个声明
};

//---------------test.cpp-------------//
#include”test.h”
template<class T>
void A<T>::f() // 模板的实现
{
…//do something
}

//---------------main.cpp---------------//
#include”test.h”
int main()
{
A<int> a;
f(); // #1
}

编译器在#1处并不知道A<int>::f的定义,因为它不在test.h里面,于是编译器只好寄希望于连接器,希望 它能够在其他.obj里面找到A<int>::f的实例,在本例中就是test.obj,然而,后者中真有A<int>::f的 二进制代码吗?NO!!!因为C++标准明确表示,当一个模板不被用到的时侯它就不该被实例化出来,test.cpp中用到了A<int>::f了吗?没有!!所以实际上test.cpp编译出来的test.obj文件中关于A::f一行二进制代码也没有,于是连接器就傻眼了,只好给出一个连接错误。但 是,如果在test.cpp中写一个函数,其中调用A<int>::f,则编译器会将其实例化出来,因为在这个点上(test.cpp中), 编译器知道模板的定义,所以能够实例化,于是,test.obj的符号导出表中就有了A<int>::f这个符号的地址,于是连接器就能够完 成任务。

关键是:在分离式编译的环境下,编译器编译 某一个.cpp文件时并不知道另一个.cpp文件的存在,也不会去查找(当遇到未决符号时它会寄希望于连接器)。这种模式在没有模板的情况下运行良好,但遇到模板时就傻眼了,因为模板仅在需要的时候才会实例化出来,所以,当编译器只看到模板的声明时,它不能实例化该模板,只能创建一个具有外部连接的符号并期待连接器能够将符号的地址决议出来。然而当实现该模板的.cpp文件中没有用到模板的实例时,编译器懒得去实例化,所以,整个工程的.obj中就找不到 一行模板实例的二进制代码,于是连接器也黔驴技穷了。


那么怎么解决这个问题呢?如我们可以这样做:

在类模板头文件template.h中: 

template<class T>  
class base  
{  
public:  
  base() {};  
  ~base() {};  
  T add_base(T x,T y);  
};  
#define _TEMPLATE_CPP_
#include "template.cpp"  
在类模板的实现文件template.cpp中:

#ifdef _TEMPLATE_CPP_  
template<class T>  
T base<T>::add_base(T x,T y)  
{  
  return x+y;  
}  
#endif  

<think>嗯,用户想了解C++中的extern关键字的作用和用法。首先,我需要回忆一下extern的基本概念。根据引用中的资料,extern用于声明外部链接的变量或函数,允许在不同文件之间共享它们。用户可能已经知道变量和函数的作用域,但可能对如何跨文件使用它们有疑问。 接下来,我应该分点解释extern的作用。比如,声明外部全局变量,这样多个文件可以共享同一个变量。例如,在文件A定义,在文件B用extern声明。然后,处理C/C++混合编程的情况,用extern "C"来避免名称修饰的问题,确保C++能正确调用C的函数。这部分可能需要举例说明,像引用中的代码示例。 还要注意extern在头文件中的使用,防止重复定义。可能需要说明如何在头文件中声明,然后在源文件中定义。另外,用户可能想知道extern和static的区别,这里可以简单对比一下,强调extern是外部链接,而static是内部链接。 用户可能的疑问包括:extern和全局变量有什么区别?为什么需要extern?如果多个文件定义同一个extern变量会发生什么?这时候需要解释声明和定义的区别,extern只是声明,不是定义,所以定义只能在某个地方出现一次。 另外,用户提到的引用中有关于分离式编译的内容,应该强调extern在模块化开发中的重要性,允许程序分割成多个文件独立编译,再链接在一起。 最后,生成相关问题时要考虑用户的后续需求,比如extern与头文件的关系,extern "C"的底层原理,常见错误场景等。这些问题能帮助用户深入理解extern的使用注意事项。 需要确保使用正确的中文表达,避免技术术语错误,并且按照用户的格式要求,行内公式用$...$,独立公式单独成段。但在这个问题中可能涉及较少数学公式,但如果有涉及变量或代码的地方,要正确使用格式。例如,变量名用代码块或斜体,函数名用代码块。 总结回答结构:先概述extern的作用,再分点详细说明每个使用场景,给出代码示例,对比其他关键字,最后常见问题解答和相关问题。确保引用标记正确,比如在讲解extern "C"时引用[^1]和[^2],在分离式编译时引用[^3]。</think>### C++ extern 关键字作用与用法详解 #### 一、extern 关键字的核心作用 1. **声明外部链接符号** `extern` 用于声明变量、函数或模板在**其他文件**中已定义,编译器无需在当前文件分配存储空间,链接时再寻找具体定义[^3]。 - 例如:在 `file1.cpp` 中定义全局变量 `int g_value = 10;`,在 `file2.cpp` 中通过 `extern int g_value;` 声明后即可使用。 2. **解决C/C++混合编程问题** 使用 `extern "C"` 包裹C语言头文件,关闭C++的名称修饰(name mangling),确保C++能正确调用C编译的函数。例如: ```cpp extern "C" { #include "c_lib.h" // C语言头文件 } ``` #### 二、具体用法场景 1. **跨文件共享全局变量** - **定义变量**(分配内存) ```cpp // file1.cpp int g_shared = 100; // 实际定义 ``` - **声明变量**(引用外部定义) ```cpp // file2.cpp extern int g_shared; // 仅声明 ``` 2. **头文件中的规范用法** 在头文件中用 `extern` 声明全局变量,避免多次包含导致重复定义: ```cpp // config.h extern int MAX_SIZE; // 声明 // config.cpp int MAX_SIZE = 1024; // 定义 ``` 3. **C++调用C函数** 通过 `extern "C"` 确保函数符号未修饰: ```cpp // main.cpp extern "C" { void c_function(); // C编译的函数 } int main() { c_function(); // 正确调用 return 0; } ``` #### 三、对比与注意事项 | 关键字 | 作用域 | 存储周期 | 典型用途 | |--------|-------------|------------|------------------------| | `extern` | 跨文件 | 静态 | 共享全局变量/函数 | | `static` | 当前文件 | 静态 | 限制作用域避免冲突 | **常见错误**: - **重复定义**:在多处文件中定义同一个 `extern` 变量,导致链接错误。 - **遗漏定义**:声明了 `extern` 变量但未在任何文件中定义,引发未解析符号错误。 #### 四、扩展应用 - **模板显式实例化**(C++11+) 结合 `extern` 声明模板实例化,减少编译时间: ```cpp // header.h extern template class std::vector<int>; // 声明 // source.cpp template class std::vector<int>; // 实际实例化 ``` --- §§ 1. `extern` 和头文件包含有何区别? 2. 为什么C++调用C函数需要 `extern "C"`?底层原理是什么? 3. 如何用 `extern` 实现跨文件的常量共享? 4. `extern "C"` 能否用于C++函数?会有什么问题? : C++中extern关键字的作用 : C/C++ extern关键字详解 [^3]: C++中extern关键字的作用
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值