13、《并行计算与形状记忆合金薄膜相变数值模拟》

《并行计算与形状记忆合金薄膜相变数值模拟》

1. 三维爆发并行模拟

1.1 并行实现策略

在三维爆发的并行模拟中,并行部分覆盖了代码的整个动态范围,仅使用了OpenMP同步指令。为了减少通信开销,MPI实现中采用的计算顺序也被用于减少同步点的等待时间。对于内积计算,同步事件通过使用由锁变量保护的计数器来实现,并添加了额外的标志以允许访问共享数据。当处理器计算完其边界数据后,会启用相应标志;若其他处理器需要这些数据,则会等待该标志启用。计数器和标志的重置通过奇偶反转标志精心实现,以提高性能并避免数据竞争条件。在消息传递和共享空间地址范式中,都避免了全局屏障,以最小化等待时间。

1.2 并行实现评估

对两种并行代码在不同架构上针对粗网格和细网格的性能进行了评估:
- 双处理器集群 :采用3.06 GHz的Intel(R) Xeon(TM)双处理器,配备2 GB RAM和512 KB缓存,节点通过两个千兆以太网网络互连,一个用于数据(NFS),另一个用于计算。
- SGI Altix 3700 Bx2系统 :拥有64个1600 MHz的Intel Itanium 2 Rev处理器,128 GB RAM和6 MB L3,基于分布式共享内存架构,采用缓存一致的非均匀内存访问(NUMA),处理器访问本地内存的延迟低于访问全局(或远程)内存的延迟。

初步评估表明,两种代码在每个时间步的计算成本相似,因此下面分析仅一个时间步的平均执行时间。
| 粗网格 | | | | 细网格 | | | |
| — | — | — | — | — |

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值