37、深入理解性能分析工具

元编程奶

于 2025-12-14 15:03:14 发布

阅读量6

点赞数

CC 4.0 BY-SA版权

分类专栏：嵌入式Linux精要解读文章标签：性能分析 perf top

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/b9c0d/article/details/155998315

嵌入式Linux精要解读专栏收录该内容

40 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

深入理解性能分析工具

1. 符号表与编译标志

在系统性能分析过程中，我们会立即遇到一个问题。虽然观察系统的自然状态很重要，但工具往往需要额外的信息才能理解事件。部分工具需要特殊的内核选项，如 perf、Ftrace 和 LTTng。因此，可能需要构建并部署新的内核进行测试。

调试符号在将原始程序地址转换为函数名和代码行方面非常有用。部署带有调试符号的可执行文件不会改变代码的执行，但需要有包含调试信息的二进制文件和内核副本，至少对于想要分析的组件需要如此。一些工具（如 perf）在目标系统上安装调试符号后才能更好地工作。

如果希望工具生成调用图，可能需要启用栈帧进行编译。若要工具准确地将地址与代码行关联起来，可能需要以较低的优化级别进行编译。最后，一些工具需要在程序中插入插桩代码来捕获样本，因此需要重新编译这些组件，如应用程序的 gprof 以及内核的 Ftrace 和 LTTng。

要注意，对所观察系统的更改越多，就越难将测量结果与生产系统联系起来。最好采取观望的方法，仅在需求明确时进行更改，并意识到每次更改都会改变测量的内容。

2. 开始性能分析

当查看整个系统时，一个很好的起点是使用像 top 这样的简单工具，它能快速提供系统的概览。它会显示内存使用量、哪些进程在占用 CPU 周期，以及这些情况在不同核心和时间上的分布。

如果 top 显示单个应用程序在用户空间占用了所有 CPU 周期，可以使用 perf 对该应用程序进行分析。
如果有两个或更多进程的 CPU 使用率较高，可能存在某种因素将它们耦合在一起，也许是数据通信。若大量周期花在系统调用或处理中断上

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。