13、硬件加速器性能分析与折叠机制

硬件加速器性能分析与折叠机制

硬件加速器的基于跟踪的性能分析

在硬件加速器的性能分析领域,事件日志/跟踪技术有着重要的应用。可以将像VampirTrace这样原本就能处理混合应用程序的跟踪基础设施进行扩展,使其能够记录加速器的使用情况。

关键要点

  • 利用现有指标 :为了不改变固定的跟踪格式(因为这会影响整个分析工具链),通过重新利用已有的指标(线程和消息)来实现对加速器使用情况的记录。
  • CUDA和OpenCL跟踪 :介绍了如何在VampirTrace中包含CUDA和OpenCL跟踪,以及这对使用Vampir进行可视化的影响。
  • 无需修改跟踪格式 :处理因使用硬件加速器而引入的额外并行级别时,不需要对跟踪格式进行修改,其性能数据可以正常记录和可视化。

面临的挑战

当前的时间线可视化会因大量的跟踪数据而不堪重负,因此需要新的方法来呈现大量的性能数据,以帮助性能分析师找出并行应用程序中的负载不平衡等问题。未来的工作还包括扩展VampirTrace以支持AMD的GPUPerfAPI。

折叠机制:基于粗采样的详细分析

性能分析工具概述

性能分析工具能帮助应用程序用户找出阻碍应用程序在当前超级计算机上全速运行的瓶颈。性能工具的详细程度和准确性对于全面描绘瓶颈的本质至关重要,其细节不仅取决于工具的类型(基于剖析或基于跟踪),还取决于收集信息所依赖的机制(插桩或采样)。

折叠机

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值