深入理解性能分析工具
1. 符号表与编译标志
在系统性能分析过程中,我们会立即遇到一个问题。虽然观察系统的自然状态很重要,但工具往往需要额外的信息才能理解事件。部分工具需要特殊的内核选项,如 perf、Ftrace 和 LTTng。因此,可能需要构建并部署新的内核进行测试。
调试符号在将原始程序地址转换为函数名和代码行方面非常有用。部署带有调试符号的可执行文件不会改变代码的执行,但需要有包含调试信息的二进制文件和内核副本,至少对于想要分析的组件需要如此。一些工具(如 perf)在目标系统上安装调试符号后才能更好地工作。
如果希望工具生成调用图,可能需要启用栈帧进行编译。若要工具准确地将地址与代码行关联起来,可能需要以较低的优化级别进行编译。最后,一些工具需要在程序中插入插桩代码来捕获样本,因此需要重新编译这些组件,如应用程序的 gprof 以及内核的 Ftrace 和 LTTng。
要注意,对所观察系统的更改越多,就越难将测量结果与生产系统联系起来。最好采取观望的方法,仅在需求明确时进行更改,并意识到每次更改都会改变测量的内容。
2. 开始性能分析
当查看整个系统时,一个很好的起点是使用像 top 这样的简单工具,它能快速提供系统的概览。它会显示内存使用量、哪些进程在占用 CPU 周期,以及这些情况在不同核心和时间上的分布。
- 如果 top 显示单个应用程序在用户空间占用了所有 CPU 周期,可以使用 perf 对该应用程序进行分析。
- 如果有两个或更多进程的 CPU 使用率较高,可能存在某种因素将它们耦合在一起,也许是数据通信。若大量周期花在系统调用或处理中断上
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



