评估OpenSHMEM显式远程内存访问操作
1. 相关技术概述
UCT(Unified Communication Transport)对底层硬件的复杂细节进行了抽象,为实现更高级别的协议提供了低级API。该API具备通信上下文管理、设备特定内存分配与管理、各类消息接口、远程内存访问(RMA)、原子内存操作(AMO)、主动消息以及集合操作等必要功能,且由互连制造商驱动。
UCP(Unified Communication Protocol)构建于UCT之上,对更高级别的协议进行了抽象,可被MPI和PGAS等编程模型使用。UCP能初始化UCX库,支持消息分段,并提供多轨通信功能。在实现显式RMA操作和合并请求时,会使用UCX网络层。OpenSHMEM参考实现负责设置对称堆并管理处理元素(PE),RMA操作可直接映射到UCP函数,因此显式非阻塞操作在UCP中实现,并在OpenSHMEM中使用一个小包装器。
2. 实验测试平台
- 系统配置 :实验在一个16节点的SGI集群上进行。该集群配备Mellanox ConnectX - 4 VPI适配器卡,支持EDR IB(100 Gb/s)和100 GbE,采用单端口QSFP和PCIe3.0 × 16。每个节点包含两个NUMA节点,每个NUMA节点有两个插槽,每个插槽有10个核心。40个CPU均为Intel Xeon E5 - 2660 v3,运行频率为2.6 GHz。
- 应用内核与基准测试 :为进行评估,使用了微基准测试和应用内核。对于评估延迟、带宽和消息速率,对OSU的基准测试进行了修改,包括将shmem接
超级会员免费看
订阅专栏 解锁全文
17

被折叠的 条评论
为什么被折叠?



