SCI 网络中 ScaMPI 与共享内存编程模型的性能分析
在并行计算领域,高效的通信机制和编程模型对于提升系统性能至关重要。本文将聚焦于 SCI(Scalable Coherent Interface)网络,深入探讨 ScaMPI 的性能表现以及共享内存编程模型的相关研究。
ScaMPI 的性能评估
SCI 网络被组织成 8 x 12 的二维网格/环面结构。ScaMPI 在 SCI 网络上展现出了出色的性能,在不同节点的两个 MPI 进程之间实现了 9.4 微秒的 ping 延迟和高达 76 MByte/s 的带宽,而在同一台 PC 上的两个进程之间,延迟仅为 4.5 微秒,带宽可达 130 MByte/s。这充分满足了 ScaMPI 设计目标中的低延迟和高带宽要求。
ScaMPI 设计目标中,集体 MPI 操作的延迟应随 O(log(N)) 增长,其中 N 为系统规模,而每个节点的带宽应在所有系统规模下接近恒定。为了验证这一目标,进行了以下两个方面的性能测试。
1. 屏障(Barrier)操作性能
屏障操作是一种不携带数据但用于同步所有进程的集体操作,因此是衡量集体延迟的良好指标。ScaMPI 的屏障实现采用了固定扇入/扇出树结构,并直接在 SCI 共享内存上运行。
节点数 | 时间(微秒) |
---|---|
2 | 8.1 |
4 | 8.2 |