高性能计算中的工作负载特征分析与性能映射
1. 引言
随着高性能计算环境和编程方法的日益复杂,并行程序的实证性能评估技术变得至关重要。工作负载特征分析是理解并行系统中工作负载性质和性能的重要工具。从系统角度来看,了解工作负载特征有助于关联架构特性对工作负载行为的影响,从而进行系统容量规划和确定需要升级的组件;从应用角度来看,它能表征特定应用在工作负载和平台方面的性能行为。本文将介绍如何利用TAU并行性能系统中的工作负载特征分析功能,来研究基于消息大小的MPI库性能。
2. 相关工作
在高性能计算的工作负载特征分析领域,有两个相关项目值得关注:
- OpenWLC系统 :这是一个可扩展的集成环境,用于系统地收集监控数据,并将工作负载特征分析技术应用于监控应用程序产生的原始数据。其框架采用基于组件的多层架构,以应对收集、存储、可视化和分析阶段的大量监控数据。
- IPM系统 :由劳伦斯伯克利实验室(LBL)为国家能源研究超级计算中心(NERSC)开发的集成性能监控系统。它可基于消息大小表征应用程序性能,利用库预加载机制对应用程序进行插桩,并将性能数据存储在性能数据仓库中,用户可通过基于Web的界面根据多个参数(如执行日期和MPI性能数据)查询应用程序特征。
此外,其他应用性能测量工具也可用于工作负载特征分析,但能够存储多实验性能数据(包括编译器和系统参数的元数据)是支持工作负载特征分析的重要标准。PerfSuite是一个基于执行时间和硬件性能计数器构建性能数据仓库的性能工具包,TAU可以与PerfSuite和其他工具合作,集成跨应用程序和平台的性能结果。
基于TAU的HPC工作负载分析
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



