1. 问题现象
执行程序到最后的时候,必现crash,堆栈提示是在析构函数。后来一番定位发现是同一个对象被析构了两次,导致double-free了。
2. 最小复现
//a.h
#ifndef A_H_
#define A_H_
#include <iostream>
struct Inner {
Inner() {
std::cout << "Construct Inner..." << std::endl;
p = new char;
}
~Inner() {
std::cout << "Destruct Inner..." << std::hex << this << std::endl;
delete p;
}
char *p;
};
struct Outer {
static Inner inner;
};
int add(int lef, int rig);
#endif
//a.cpp
#include <iostream>
#include "a.h"
Inner Outer::inner;
int add(int lef, int rig) {
return lef + rig;
}
//test.cpp
#include <iostream>
#include "a.h"
Inner Outer::inner;
int main() {
std::cout << add(3, 5) << std::endl;
return 0;
}
上述三段代码,通过下面指令可复现问题:
$ g++ -shared -fPIC -o liba.so a.cpp
$ g++ test.cpp -o test -L. -la
$ ./test
Construct Inner...
Construct Inner...
8
Destruct Inner...0x6503bbc67158
Destruct Inner...0x6503bbc67158
free(): double free detected in tcache 2
Aborted
3. 问题解释
这应该是编译器的一个缺陷,当一个库里的类中含有静态对象,并且静态对象也是一个类的时候。(按照标准,应该在a.h中声明,在a.cpp中定义),然后由于某种原因,可执行文件中也定义了一次这个静态变量。(在我们的程序中是由于编译脚本的问题,导致a.cpp先被静态链接了一次,liba.so又被动态链接一次)。这时候就会导致可执行文件的BSS中有这个符号,它链接的so里也有这个符号,但编译器认为他们是同一个对象,这时候就会出现double-free问题。
4. 最佳实践
在使用自动编译脚本(cmake,bazel等)时,如果编译过程不清晰,可能触发编译器的bug,所以库的构建依赖关系,要弄明白。