优化拓扑感知节点映射的工具集探索
在高性能计算(HPC)领域,现代系统如Cray的XE和IBM的Blue Gene系列,都具备复杂的网络架构,通常呈现为高维环面形式。为了充分发挥这些系统的性能,需要将应用程序的通信结构与底层网络拓扑进行细致映射。在这个过程中,延迟(节点间的物理距离)和带宽(同时使用的链路数量)都需要考虑,这往往会导致映射结果违背直觉。为了帮助开发者解决这个复杂问题,相关人员正在开发一套工具,旨在帮助用户理解代码的通信行为,将其映射到网络架构上,并创建性能更优的拓扑感知节点映射。
1. 动机与背景
现代HPC架构的互连网络通常采用高维环面结构,例如IBM Blue Gene系列、Cray的XT/XE系统以及富士通的K计算机。由于这些网络每个节点的链路数量恒定,相对易于部署和扩展。然而,高网络直径会给应用程序带来性能和扩展方面的问题。因此,必须精心规划应用程序任务在底层网络拓扑上的布局,以确保通信效率与应用程序的特定模式相匹配。
拓扑映射问题在相关文献中已有充分记载。例如,在对第一性原理分子动力学(FPMD)应用程序进行优化时,发现默认布局和最佳布局之间的性能差异高达64%,而且最佳映射结果与先前的预期相悖,十分反直觉。
为了实现这样的优化,需要工具来帮助用户理解应用程序的通信模式、它们如何映射到硬件拓扑、这对性能有何影响,最终为应用程序提供高效的节点映射。为了达成这一目标,会利用在多个独立领域收集的性能数据,为用户提供有关代码性能的有价值视角。还可以将一个领域收集的数据映射到另一个领域,从而比较和关联不同领域中的性能数据和特征。具体来说,主要关注通信领域(代表应用程序的通信模式)和硬件领域(收集网络统计信息)的数据,这有助于理解特定布局下应用程
超级会员免费看
订阅专栏 解锁全文
1011

被折叠的 条评论
为什么被折叠?



