Linux系统性能分析工具全解析
1. 符号表与编译标志
在对系统进行性能分析时,虽然观察系统的自然状态很重要,但工具往往需要额外的信息来理解事件。部分工具,如 perf、Ftrace 和 LTTng,需要特殊的内核选项,这可能意味着你要构建并部署新的内核。
调试符号在将原始程序地址转换为函数名和代码行时非常有用。部署带有调试符号的可执行文件不会改变代码的执行,但需要有包含调试信息的二进制文件和内核副本。一些工具,如 perf,在目标系统上安装这些调试符号后能更好地工作。
若要工具生成调用图,可能需要启用栈帧进行编译;若要工具准确地将地址与代码行关联起来,可能需要降低优化级别进行编译。此外,一些工具需要在程序中插入检测代码来捕获样本,这就需要重新编译相关组件,例如应用程序的 gprof 以及内核的 Ftrace 和 LTTng。
需要注意的是,对观察的系统改动越多,就越难将测量结果与生产系统关联起来。因此,最好采取观望的态度,只有在需求明确时再进行更改,并意识到每次更改都会改变测量的内容。
2. 开始性能分析
分析整个系统时,像 top 这样的简单工具是很好的起点,它能快速提供系统的概览,显示内存使用情况、占用 CPU 周期的进程,以及这些情况在不同核心和时间上的分布。
- 如果 top 显示单个应用程序在用户空间占用了所有 CPU 周期,可以使用 perf 对该应用程序进行分析。
- 如果有两个或多个进程的 CPU 使用率较高,可能存在某种因素将它们耦合在一起,比如数据通信。若大量周期花在系统调用或处理中断上,可能是内核配置或设备驱动有问题。在这两种情况下,都需要使用 perf 对整个系统进行分