MPI 性能模型与 PMI 接口解析
1. MPI 性能模型分析
在大规模系统中,MPI(Message Passing Interface)实现的性能建模至关重要。特别是在 petascale 或 exascale 这样的超大规模系统的算法和应用设计与验证中,准确的分析性能模型能帮助用户做出算法决策和分析可扩展性。
以环形网络为例,假设网络中有 $6k^3$ 条链路,在理想路由情况下,每条链路的拥塞程度 $C(k) \leq \frac{N(k)}{6k^3} = 2d(d + 1)^3 = O(k^4)$ 。当 $k^3 = P$ 时,$C(P) \leq \sqrt[3]{P}(\frac{\sqrt[3]{P}}{2} + 1)^3 = O(P\sqrt[3]{P})$ 。因此,环形网络上带宽受限的全对全通信(alltoall)的下限为:$T_{A2A} \geq g(P - 1) + \frac{SG}{\sqrt[3]{P}(\frac{\sqrt[3]{P}}{2} + 1)^3}$ 。
从图 3(b) 展示的 alltoall 通信的边界和基准测试结果来看,BG/P 的 alltoall 实现仍有进一步优化的潜力。Faraj 等人建议增加 FIFO(First In First Out)的数量来缓解这个问题。
2. 过程管理接口 PMI 概述
在高性能计算(HPC)系统中,进程管理是不可或缺的一部分,但过去它没有得到与并行系统软件其他方面相同程度的关注。随着 HPC 系统规模的不断扩大,可扩展的进程管理基础设施变得至关重要。
PMI(Process Management Interface)是为并行应
超级会员免费看
订阅专栏 解锁全文
396

被折叠的 条评论
为什么被折叠?



