程序的链接和加载基础(1)

1. 程序的链接

 

程序链接的核心是找符号,即函数或者变量定义的位置。符号可能位于其它程序文件,静态库,动态库,如果没找到,编译器可能报错,还可能帮你生成一个。

 


1.1 窥豹一斑 c++extern关键字

 

c++编写的so,希望在c中使用。因为某种原因,c中只能用gcc编译器。

 

$ cat e.cc

const char *ecc(const char *x) { return x; }

$ gcc -o libecc.so -shared -fPIC -Wall e.cc

 

 

注意这里,我用了gcc编译,而不是g++,它的影响在1.2中可以看到。

 

 

$ cat main.cc            

int main() { ecc("Hello World"); return 0; }

$ cat main.c

int main() { ecc("Hello World"); return 0; }

 

 

main.c 和 main.cc 文件内容相同,文件名不同。

 

 

$ gcc -o main-cc main.cc -Wall

main.cc: In function 'int main()':

main.cc:1: error: 'ecc' was not declared in this scope

 

$ gcc -o main-c main.c -Wall 

main.c: In function 'main':

main.c:1: warningimplicit declaration of function 'ecc'

/tmp/ccwO2sQc.o: In function `main':

main.c:(.text+0xf): undefined reference to `ecc'

collect2: ld returned 1 exit status

 

 

同样的程序,报错完全不同。main.cc 报编译错误,找不到ecc的声明。main.c 链接错误,没有定义ecc,但是给出了警告,说没有声明ecc。稍后讲为什么。

 

 

$ cat main.cc

struct A { A(const char *s) { } };

extern int ecc(const A &);

int main() { ecc("Hello World"); return 0; }

 

$ gcc -o main-cc main.cc -Wall

/tmp/ccq4LsaY.o: In function `main':

main.cc:(.text+0x1b): undefined reference to `ecc(A const&)'

/tmp/ccq4LsaY.o:(.eh_frame+0x12): undefined reference to `__gxx_personality_v0'

collect2: ld returned 1 exit status

 

 

现在没有编译错误了,这里提供了函数声明,虽然这个声明和我们想要链接的函数一点不搭边,但是还是编译通过了。编译时只认函数原型,这里const char* 被隐式转成了A。现在报链接错误,注意这里报找不到ecc(A const&),而不是ecc(const char *)

 

 

$ cat main.cc

extern int ecc(const char *);

int main() { ecc("Hello World"); return 0; }

 

$ g++ -o main-cc main.cc -Wall -L. -lecc

 

 

现在编译,链接都没有问题。注意,虽然提供了错误的函数声明(返回值不对),但是编译和链接都不在乎这个,所以编译,链接都没有问题。这种三不管,会导致问题。

 

 

再来看 main.c

$ gcc -o main-c main.c -Wall -L. -lecc

main.c: In function 'main':

main.c:1: warning: implicit declaration of function 'ecc'

/tmp/ccADJnMJ.o: In function `main':

main.c:(.text+0xf): undefined reference to `ecc'

./libecc.so: undefined reference to `__gxx_personality_v0'

collect2: ld returned 1 exit status

 

 

已经用 -L 和 -l 指明了连接的库,还是找不到符号,为什么?

 

$ nm libecc.so | grep ecc

000000000000051c T _Z3eccPKc

 

的确没有ecc这个符号,因为libecc.so c++编译出来的so(虽然,我们用的是gcc),而c++为了支持namespace和函数重载,做了名字混淆。

 

仲么办?

 

$ cat main.c

int main() { _Z3eccPKc("Hello World"); return 0; }

$ gcc -o main-c main.c -Wall -L. -lecc -lstdc++

main.c: In function 'main':

main.c:1: warning: implicit declaration of function '_Z3eccPKc'

 

 

现在虽然有一个警告,但是编译链接通过。我们显式指定了libecc.soecc对应的名字。从这一步可以看出,链接器很好骗(要是女人也这么好骗就行了:)),它要的只是一个符号的名字。

这种方法,无疑非常的丑陋,但是如果不修改 libecc.so 的源文件,这是唯一的方法了。

 

 

$ cat e.cc

extern "C"

const char *ecc(const char *x) { return x; }

$ cat main.c

int main() { ecc("Hello World"); return 0; }

 

$ nm libecc.so | grep ecc

000000000000050c T ecc

 

 

通过 extern "C" 显式的告诉gcc,这个函数使用c语言的方式生成函数名字。这次main.c可以编译通过,但是main.cc又不可以了。因为main.cc要找的是_Z3eccPKc,而不是ecc

 

 

$ cat main.cc 

extern "C" int ecc(const char *);

int main() { int i = ecc("Hello World"); return i; }

 

 

这里显式告诉gcc,找ecc这个符号时,不要做函数名混淆。


 

从上面的演示过程可以看出,链接时,所需的就是符号的名字(无论是ecc,还是_Z3eccPKc,所以碰到链接错误,只要考虑能不能找到这个名字。

 


1.2 gcc 和 g++ 的差别

 

我们通常所说的编译,其实分四个阶段,预处理(-E)编译(-c)汇编(-S接。一直到到接,使用gccg++是没有区别的。其实一直到接,它们也是没有区别的。前面的错误里面有

./libecc.so: undefined reference to `__gxx_personality_v0',后来为什么没了?因为gcc 加了 -lstdc++。不用我说,你也猜得到,libstdc++.so 里定义了 __gxx_personality_v0

 

 

objdump -d /usr/lib/libstdc++.so.6 | grep "__gxx_personality_v0"

00d580c0 <__gxx_personality_v0>:

 

 

因为c++增加了对象的构造和析构,所以需要编译器生成额外的代码,这个过程也是找符号而已。让gcc链接c++so,还要显示libstdc++.so 是不是觉得怪怪的,没关系,如果我在生成libecc.so时使用g++而不是gcc,那么在连接main.c时就不需要-lstdc++了。

 

 

$ g++ -o libecc.so -shared -fPIC -Wall e.cc

$ readelf -d libecc.so 

 0x0000000000000001 (NEEDED)             Shared library: [libstdc++.so.6]

 


1.3 静态库和动态库的编译

 

$ g++ -o libecc.so -shared -fPIC -Wall e.cc 

$ g++ -o ecc.o -c e.cc -Wall -fPIC; ar -r libecc.a ecc.o 

$ ls libecc.*

libecc.a  libecc.so

 

 

使用静态库注意,libecc.a 要放到.c 或者.o 文件的后面

$ gcc -o main-c main.c -L. -lecc -Wall

$ gcc -o main-c main.c libecc.a -Wall -lstdc++

 

 

还可以用链接动态库的方式连接静态库,假如当前目录有libecc.a,以这种方式链接,需要静态库的命名,符合动态库的命名规则,lib+name+.a加上libecc.a不包含任何动态链接信息(libecc.so包含动态链接信息,这里的libstdc++只是个例子,如果在libecc.a中使用了openssl,那么使用静态库时也必须-lssl),所以,必须-lstdc++

 

$ gcc -o main-c main.c -L. -lecc -Wall -lstdc++

 

 

假设当前目录同时有libecc.alibecc.so,则优先链接动态库。通过-static参数强制使用库的静态版本,注意此时(所有)需要链接的库必须有静态库版本存在。没有办法以静态方式链接动态库。


1.4 编写c++动态库常用的手法

 

提供c语言包装函数,extern "C" { /* function define code */ }

提供c语言的头文件,__cplusplus 保证了cc++都可以使用

#ifdef __cplusplus

extern "C" {

#endif

/* function declare code */

#ifdef __cplusplus

}

#endif

 


1.5 c 和 c++ 对待函数原型的问题

 

在上文,main.c 和 main.cc 都没有声明ecc函数原型(也没有-l指定动态库),main.c 报链接错误,main.cc 报编译错误,为什么?

 

$ gcc -o main-cc main.cc

main.cc:1: error: 'ecc' was not declared in this scope

 

$ gcc -o main-c main.c

main.c:(.text+0xf): undefined reference to `ecc'

 

 

这是cc++不同的地方,在c++中,编译时必须看到函数声明(原型),而在c中则不然。在C99之前,如果编译过程中找不到函数原型,会使用默认函数原型,返回值类型为int,参数类型为传递的参数类型。并且在满足下面4个条件是,默认函数原型工作正确。

1. 如果函数返回int

2. 如果函数函数有固定个数的参数。

3. 参数类型是类型提升后的。(例如int是好的,char不行,因为int是类型提升后的)。

4. 传递的参数个数正确。

 

 

$ cat main.c 

#include 

int main() { printf("%d\n", (int) atof("1234.3")); return 0; }

$ gcc main.c -o main; ./main

858993459

 

 

正确的输出应该是1234,但是这里输出了858993459。因为atofstdlib.h中声明,而我们没有包含这个头文件,程序编译使用原型是 int atof(const char *nptr); 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值