性能分析与跟踪工具详解
1. 调用图
在进行性能分析时,列表顶部的函数大多是底层内存操作,这些函数通常已经经过优化。为了进一步了解这些函数的调用来源,可以使用 perf record
的 -g
选项捕获每个样本的回溯信息。
使用该选项后, perf report
会在函数属于调用链的位置显示一个加号(+),可以展开跟踪信息查看调用链中更底层的函数。生成调用图依赖于从栈中提取调用帧的能力,这与 GDB 中的回溯操作类似。不过,并非所有架构和工具链的组合都能实现栈展开,相关信息编码在可执行文件的调试信息中。
2. perf annotate
当确定了需要关注的函数后,可以使用 perf annotate
深入查看函数代码并获取每条指令的命中计数。该工具通过调用目标设备上安装的 objdump
副本来实现此功能,只需将 perf report
替换为 perf annotate
即可。
perf annotate
需要可执行文件和 vmlinux
的符号表。如果想查看源代码与汇编代码交错显示的内容,可以将相关源文件复制到目标设备。若使用 Yocto Project 并启用了 dbg-pkgs
额外镜像功能,或安装了单独的 -dbg
包,源文件会被安装在 /usr/src/debug
目录下