事件跟踪中重复模式的可视化与性能分析
1. 性能跟踪概述
事件跟踪是计算机程序性能分析的常用方法,尤其在并行和高性能计算(HPC)领域。随着HPC的发展,事件跟踪产生的跟踪数据量不断增大,这主要归因于以下几个方面:
- 硬件进步 :更快的处理器和更高的并行度。
- 更详细的检测 :更细致的检测和更多的数据来源增加了跟踪数据的体积。
- 存储容量提升 :更大的内存和存储容量使得跟踪数据可以不断增长。
这使得跟踪分析和可视化成为一项具有挑战性的任务,因为人类的感知能力无法随着数据量的增长而提升,同时也不能要求使用超级计算机来分析超级计算机的跟踪数据。
2. 跟踪数据与信息的差异
跟踪数据大小的增长有多种原因:
- 软件规模 :更大的软件项目和更复杂的源代码。
- 检测和测量的发展 :提供了更多的数据,如处理器、通信子系统和I/O后端的性能计数器。
- 程序执行 :更长或更快运行的程序以及更多的并行性增加了某些程序部分的重复执行次数。
前两个原因对跟踪数据大小的影响较小,而第三个原因是导致当今数十GB跟踪数据的主要原因。一般来说,迭代次数或运行时间翻倍,或者并行进程数量翻倍,跟踪数据大小也会翻倍。
从信息的角度来看,情况有所不同。例如,假设一个有趣的情况可以描述为“序列A重复n次”,当这个序列重复4n次时,对于人类用户来说,这不一定意味着信
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



