非键相互作用计算算法与自引力气尘系统并行3D代码的研究
非键相互作用计算算法实现
移植策略与测试
从3.2版本开始,MOLKERN程序被移植到Cell架构。不过该移植策略存在一个缺点,粗略估计其加速比不超过4。为了测试算法Cell版本的性能,选取了3种蛋白质(1AIE、1AF2和1GC1),它们所在的单元格分别包含2008、5346和36873个水分子。将其与完全由PPE执行的顺序MOLKERN版本进行对比,结果是通过对几何优化前五次迭代的短程相互作用计算执行时间求平均值得到的。非键相互作用的计算涉及6 - 12范德华势、短程库仑分量erfc(√π * r / rcut) / r和长程库仑分量erf(√π * r / rcut) / r。
结果与讨论
图展示了MOLKERN计算短程非键相互作用的加速比与所使用SPE数量的关系,呈现了不同SPE代码版本的结果,包括:
- (a) 无SIMD扩展的双精度版本;
- (b) 有SIMD扩展的双精度版本;
- (c) 无SIMD扩展的单精度版本;
- (d) 有SIMD扩展的单精度版本。
对于(a)、(b)和(c),SPE被完全加载,计算速度随SPE数量线性增加。在(c)情况下,使用全部16个SPE时,所有代码的最大加速比达到14.6。当在单精度下使用SIMD扩展(d)时,使用8个SPE可实现最大加速比31.6。加速比与SPE数量的关系并非线性,这表明
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



