注入带宽性能对应用程序可扩展性及内核辅助 MPI 通信的影响
一、注入带宽性能对应用程序可扩展性的影响
1. 网络带宽测量结果
测量了不同注入带宽降级水平下两个相邻节点之间的网络带宽。标签约定如下:
- None = (800 MHz, 16 bit)
- Half = (400 MHz, 16 bit)
- Quarter = (200 MHz, 16 bit)
- Eighth = (200 MHz, 8 bit)
流测试(图 1b)的带宽曲线比乒乓测试(图 1a)上升更快,渐近水平略高。一次发送少量消息的应用程序行为更像乒乓测试,一次发送大量消息的应用程序行为更像流测试。对每种配置的小消息延迟进行测量,发现与无降级时大致相同(< 1.0 µs)。
测量类型 | 描述 |
---|---|
乒乓测试 | 一次发送少量消息,带宽曲线上升较慢,渐近水平略低 |
流测试 | 一次发送大量消息,带宽曲线上升快,渐近水平略高 |
2. 网络注入带宽与计算平衡比
使用测试系统得到的网络注入带宽与计算平衡比列于表 3。这些比率通过图 1b 中测量的渐近最大节点级带宽(GB/s)除以每个计算节点的 115.2 GFLOPS 峰值计算能力得出。最低实现的平衡比 0.0030 比全