硬件加速器性能分析与折叠机制
硬件加速器的基于跟踪的性能分析
在硬件加速器的性能分析领域,事件日志/跟踪技术有着重要的应用。可以将像VampirTrace这样原本就能处理混合应用程序的跟踪基础设施进行扩展,使其能够记录加速器的使用情况。
关键要点
- 利用现有指标 :为了不改变固定的跟踪格式(因为这会影响整个分析工具链),通过重新利用已有的指标(线程和消息)来实现对加速器使用情况的记录。
- CUDA和OpenCL跟踪 :介绍了如何在VampirTrace中包含CUDA和OpenCL跟踪,以及这对使用Vampir进行可视化的影响。
- 无需修改跟踪格式 :处理因使用硬件加速器而引入的额外并行级别时,不需要对跟踪格式进行修改,其性能数据可以正常记录和可视化。
面临的挑战
当前的时间线可视化会因大量的跟踪数据而不堪重负,因此需要新的方法来呈现大量的性能数据,以帮助性能分析师找出并行应用程序中的负载不平衡等问题。未来的工作还包括扩展VampirTrace以支持AMD的GPUPerfAPI。
折叠机制:基于粗采样的详细分析
性能分析工具概述
性能分析工具能帮助应用程序用户找出阻碍应用程序在当前超级计算机上全速运行的瓶颈。性能工具的详细程度和准确性对于全面描绘瓶颈的本质至关重要,其细节不仅取决于工具的类型(基于剖析或基于跟踪),还取决于收集信息所依赖的机制(插桩或采样)。
超级会员免费看
订阅专栏 解锁全文
1069

被折叠的 条评论
为什么被折叠?



