共享内存并行计算技术解析
1. 引言
共享内存机器通常处理器数量相对较少,一般在 2 - 128 个之间。这类机器的内在特性包括内存一致性策略,以及用于从公共可访问内存系统分发数据的快速紧密耦合网络。测试示例在两个 HP Superdome 集群上运行:Stardust 是一台拥有 64 个 PA - 8700 处理器的生产机器,Pegasus 则是一台具有相同类型处理器的 32 CPU 机器。
2. HP9000 Superdome 机器
HP9000 被分组为多个单元(Cell),每个单元包含 4 个 CPU、一个公共内存,并连接到 CCNUMA 交叉开关网络。该网络由多组 4 x 4 交叉开关组成。通过 EFF_BW 基准测试,将处理器分为两个大小相等的集合,在集合元素间进行任意配对,测量固定数量处理器和不同消息大小下网络的横截面带宽。从 Stardust 机器的测试结果来看,网络的横截面带宽相当高,且测试延迟不高,但由于 MPI_Wtime 的增量分辨率较低,需要多次测试来量化延迟,Dr Byrde 的测试显示最小延迟大于 1.5 μs。
3. Cray XI 机器
Cray XI 机器是共享内存架构的一个典型示例。每个多流处理器(MSP)包含 4 个由 IBM 定制设计的处理器芯片和 4 个相应的缓存。每个节点有 4 个这样的 MSP 和 16 个共享公共(一致)内存视图的内存模块。向量内存访问允许绕过缓存,即向量寄存器可直接从内存加载。缓存一致性仅在单个节点内维持,节点之间使用消息传递。
4. NEC SX - 6 机器
NEC SX - 6 系列是向量 CPU 与公共内存系统
超级会员免费看
订阅专栏 解锁全文
3823

被折叠的 条评论
为什么被折叠?



