并行计算技术在分子动力学与高能物理实验中的应用
1. GROMOS96的共享内存并行化
1.1 并行化面临的问题
在对GROMOS96进行共享内存并行化时,存在一些影响性能和可扩展性的问题:
- 远程内存访问比例增加 :随着机器数量的增多,每个进程本地的全局共享内存比例会下降,远程内存访问的比例会与机器数量成正比增长。
- 共享内存区域切换开销增大 :由于数据需要在更多计算节点上复制,共享内存区域在共享和复制之间切换的相对开销会增加。
- 顺序部分限制可扩展性 :根据阿姆达尔定律,程序中剩余的顺序部分会限制更高程度并行化的可扩展性。
这些问题源于将代码修改限制在少数函数,并仅对最耗时的模块进行并行化的策略。不过,这种方法是经过深思熟虑的,并且取得了一定的成效。
1.2 性能对比
将并行化代码的性能与其他并行GROMOS实现进行对比是很有意义的。不同项目和平台的测试结果如下:
| 项目/平台 | 数据规模 | 处理器数量 | 加速比范围 | 代码情况 |
| — | — | — | — | — |
| Europort项目(部分并行) | ∼2,000 - ∼30,000原子 | 8 | 4.4 - 5.6 | 未完全并行化 |
| Europort项目(完全并行) | ∼2,000 - ∼30,000原子 | 8 | 4.8 - 6.7 | 完全并行化 |
| 国家超级计算应用中心(UHGROMOS) | 10,000 - 15,000原子
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



