11、共享内存并行计算技术解析

共享内存并行计算技术解析

1. 引言

共享内存机器通常处理器数量相对较少,一般在 2 - 128 个之间。这类机器的内在特性包括内存一致性策略,以及用于从公共可访问内存系统分发数据的快速紧密耦合网络。测试示例在两个 HP Superdome 集群上运行:Stardust 是一台拥有 64 个 PA - 8700 处理器的生产机器,Pegasus 则是一台具有相同类型处理器的 32 CPU 机器。

2. HP9000 Superdome 机器

HP9000 被分组为多个单元(Cell),每个单元包含 4 个 CPU、一个公共内存,并连接到 CCNUMA 交叉开关网络。该网络由多组 4 x 4 交叉开关组成。通过 EFF_BW 基准测试,将处理器分为两个大小相等的集合,在集合元素间进行任意配对,测量固定数量处理器和不同消息大小下网络的横截面带宽。从 Stardust 机器的测试结果来看,网络的横截面带宽相当高,且测试延迟不高,但由于 MPI_Wtime 的增量分辨率较低,需要多次测试来量化延迟,Dr Byrde 的测试显示最小延迟大于 1.5 μs。

3. Cray XI 机器

Cray XI 机器是共享内存架构的一个典型示例。每个多流处理器(MSP)包含 4 个由 IBM 定制设计的处理器芯片和 4 个相应的缓存。每个节点有 4 个这样的 MSP 和 16 个共享公共(一致)内存视图的内存模块。向量内存访问允许绕过缓存,即向量寄存器可直接从内存加载。缓存一致性仅在单个节点内维持,节点之间使用消息传递。

4. NEC SX - 6 机器

NEC SX - 6 系列是向量 CPU 与公共内存系统

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值