硬件加速器的基于跟踪的性能分析
在当今的高性能计算(HPC)领域,硬件加速器如CUDA和OpenCL等得到了广泛应用。本文将深入探讨硬件加速器相关的性能分析,包括相关工具、面临的挑战以及具体的实现方法。
1. 相关工作
硬件加速器生态系统除了加速器硬件外,还包括软件环境,通常由编译器、调试器和性能分析工具组成。以下是不同厂商提供的工具:
| 厂商 | 工具 | 支持平台 |
| ---- | ---- | ---- |
| NVIDIA | Visual Profiler、NVIDIA Parallel NSight | 所有支持CUDA的平台 |
| AMD | APP Profiler | AMD APUs和AMD Radeon GPUs |
| IBM | Cell/B.E. 提供的分析和跟踪工具 | IBM Cell/B.E. 架构 |
| Clearspeed | Visual Profiler | Clearspeed加速器 |
研究型性能工具也开始支持硬件加速器,主要分为两类:
- 扩展现有HPC工具 :如TAU、IPM和HPCToolkit,它们具有分析背景。TAU和HPCToolkit使用NVIDIA CUPTI API的回调来获取GPU相关性能数据,IPM使用库包装在API级别拦截GPU - 主机交互。
- 针对特定加速器设计的新工具 :如GPU Ocelot,它主要是一个代码开发框架,也可用于收集性能数据,但缺乏扩展到所有并行级别的能力。
超级会员免费看
订阅专栏 解锁全文
10万+

被折叠的 条评论
为什么被折叠?



