性能分析与跟踪工具全解析
1. 调用图分析
在性能分析过程中,仅查看函数列表往往不能让事情变得简单。列表顶部的函数大多是底层内存操作,这些操作通常已经经过了优化。为了进一步了解这些函数的调用来源,可以使用 perf record
命令的 -g
选项捕获每个样本的回溯信息。
使用该选项后, perf report
会在函数属于调用链的位置显示一个加号(+),通过展开跟踪信息,可以查看调用链中更底层的函数。生成调用图依赖于从栈中提取调用帧的能力,这与 GDB 中的回溯操作类似。展开栈所需的信息编码在可执行文件的调试信息中,但并非所有架构和工具链的组合都支持这一操作。
2. perf annotate 工具
当确定了需要关注的函数后,可能希望深入查看函数代码并了解每条指令的命中次数, perf annotate
工具可以满足这一需求。它通过调用目标设备上安装的 objdump
副本来实现该功能,使用时只需将 perf report
替换为 perf annotate
即可。
perf annotate
需要可执行文件和 vmlinux
的符号表。如果想查看与汇编代码交错显示的源代码,可以将相关源文件复制到目标设备。若使用 Yocto Project 并启用了 dbg-pkgs
额外镜像功能,或者安装了单独的 -dbg