强制链接静态库所有符号(包括未被使用的)

本文介绍了一种在C++项目中,如何确保静态库的所有符号都被包含在最终的二进制文件中的方法,这对于执行代码覆盖率统计或实现动态插件机制等场景尤为重要。文章详细解释了使用dumpbin和Python脚本自动生成头文件,以便在链接阶段强制包括所有静态库符号。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

C++程序在链接一个静态库时,如果该静态库里的某些方法没有任何地方调用到,最终这些没有被调用到的方法或变量将会被丢弃掉,不会被链接到目标程序中。这样做大大减小生成二进制文件的体积。但是,某些时候,即使静态库里的某些方法没有任何地方使用到,我们也希望将这些没有使用到的代码编译进最终的二进制文件中。

为什么会有这样的需求?的确,存在这种需求的是少数情况,但是一旦你遇到下面的需求,就变得必须了。比如:

  1. 动态插件机制。代码中没有直接调用某方法,但是希望能在运行时动态加载执行某方法。
  2. 执行代码覆盖率统计。需要统计静态库所有代码的覆盖情况,而不只是被使用到的代码覆盖情况。

如果是gcc编译,比较好办,只需要加上--whole-archive链接选项。但是在Windows平台,微软的编译器没有这样的选项,一个最接近的选项是/OPT:NOREF

文档见:https://msdn.microsoft.com/en-us/library/bxwfs976.aspx
说明:/OPT:REF eliminates functions and data that are never referenced; /OPT:NOREF keeps functions and data that are never referenced.

/OPT:NOREF在Debug下是默认打开的,而且只能强制保留本工程未被使用到的函数和变量。对于引用的静态库的未被使用的函数和变量是不生效的。甚至有人认为这是微软的BUG在这个帖子里热烈讨论过:LINK.EXE BUG: /OPT:NOREF option doesn't work!

遇到同样问题的可不止我一个人,比如StackOverFlow里就有人问:What is the Visual studio equivalent to GNU ld option --whole-archive

有人建议他用/INCLUDE 选项强制链接未使用的符号,也有人说使用/OPT:NOREF(显然不行)。

使用/INCLUDE 指定某个符号强制链接是可以的。但是,假如静态库中有成百上千个符号需要强制/INCLUDE,怎么办?

所以,最好的方法,也是上面讨论/OPT:NOREF BUG的帖子里有人提到的方法,就是在代码中使用:

#pragma comment(linker, "/include:?emptyreference@Noisy@@QAEXXZ")
  

通过上面的方法,可以让链接器强制include一个符号,include:后面的是符号名称。如果要强制include静态库中所有符号,需要把静态库中的所有符号找出来,然后通过上面的方法强制include。

人手工找出所有Symbols,然后添加上面的代码是不太靠谱的。一方面Symbols的格式可读性太差不好维护,另一方面假如静态库符号信息修改了,这个维护代价就更大了。所以,必须让这个过程自动完成。

查看静态库所有符号列表,Linux里可以使用nm ,Windows平台可以使用dumpbin

执行dumbin.exe需要注意,必须在Visual Studio的开发命令行环境才能执行。不过有个小技巧可以让你不必在Developer Command Prompt执行,就是假如是VS2013环境,建一个批处理,在开头加上:


  
  1. @echo off
  2. if defined VS120COMNTOOLS (
  3. call "%VS120COMNTOOLS%\vsvars32.bat")

我们使用dumpbin /LINKERMEMBER xxx.lib,可以列出所有的符号名字,比如查看静态库MyLib.lib所有符号:


  
  1. d:\Code\Cpp\LinkAllSymbols\Debug>dumpbin.exe /linkermember: 1 MyLib.lib
  2. Microsoft (R) COFF/PE Dumper Version 12.00 .30501 .0
  3. Copyright (C) Microsoft Corporation. All rights reserved.
  4. Dump of file MyLib.lib
  5. File Type: LIBRARY
  6. Archive member name at 8: /
  7. 557D4C17 time/date Sun Jun 14 17: 40: 39 2015
  8. uid
  9. gid
  10. 0 mode
  11. ED size
  12. correct header end
  13. 9 public symbols
  14. 328 ?? 4 Turtle@ @QAEAAV0 @ABV0@ @Z
  15. 328 ?? _C@ _0M@ KEAKLOKJ@Turtle? 5run? 4?$ AA@
  16. 328 ? Download@ @YAHXZ
  17. 328 ? Run@ Turtle@ @QAEXXZ
  18. 19CE ? FishRun@ @YAXXZ
  19. 19CE ? Run@ Fish@ @QAEXXZ
  20. 2D16 ?? _C@ _08EMEDHABH@Dog? 5run? 4?$ AA@
  21. 2D16 ? Foo@ @YAHXZ
  22. 2D16 ? Run@ Dog@ @QAEXXZ
  23. Summary
  24. 28B4 .debug$S
  25. F0 .debug$T
  26. 102 .drectve
  27. 15 .rdata
  28. C .rtc$IMZ
  29. C .rtc$TMZ
  30. 15A .text$mn

因此,只需要执行dumpbin,并且在输出结果中抽取出所有的符号名称,然后自动生成#pragma comment(linker, "/include:xxx")代码即可。

于是,我写了一个Python脚本,执行dumpbin,然后通过正则表达式拿到所有符号名称,自动生成强制include了所有符号的头文件。关键代码如下:


  
  1. import re
  2. regex = re.compile(r"\s+.*\s([\?_]+.*)")
  3. exclude = []
  4. def gen_header_file_for_lib(lib_path, header_path):
  5. cmd = ['dumpbin.exe','/linkermember:1', lib_path]
  6. lines = execute_command(cmd)
  7. symbols = find_matches(lines, regex, exclude)
  8. with open(header_path, 'w') as f:
  9. header_guard = "LINK_ALL_SYMBOLS_H_"
  10. f.write("#ifndef " + header_guard + '\n')
  11. f.write("#define " + header_guard + '\n')
  12. f.write("// Generated by GenLinkerSymbols.py. Do not modify! \n\n")
  13. for symbol in symbols:
  14. pragma_line = '#pragma comment(linker, "/include:' + symbol + '")'
  15. f.write(pragma_line + '\n')
  16. f.write("\n#endif // " + header_guard + '\n')
  17. print("Link symbols count: %s" % len(symbols))
  18. def find_matches(lines, regex, exclude_list):
  19. def match(line):
  20. m = regex.match(line)
  21. if m:
  22. return m.group(1).split()[0]
  23. return None
  24. def exclude_filter(line):
  25. if not line:
  26. return False
  27. for exclude in exclude_list:
  28. if line.find(exclude) >= 0:
  29. return False
  30. return True
  31. matches = filter(exclude_filter, map(match, lines))
  32. return list(set(matches))

结合Visual Studio工程配置里的Post-Build Event,就可以在编译静态库之后自动更新头文件了。比如:

python ..\GenSymbolsHeader.py $(OutDir)$(TargetName)$(TargetExt) ..\Include\LinkAllSymbols.h
  

在使用该静态库的工程代码中,只需要#include "LinkAllSymbols.h" 就可以了。

对比

使用OpenCppCoverage进行代码覆盖率测试,对比如下:

正常情况下,不强制在linker时include静态库所有符号时,代码覆盖率结果为:

noinclude

通过上面的方法,自动生成LinkAllSymbols.h并#include "LinkAllSymbols.h",覆盖率结果为:

included

github

所有代码见:https://github.com/coderzh/LinkAllSymbols

转载于:https://www.cnblogs.com/coderzh/p/LinkAllSymbols.html
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值