科学计算中的性能优化与数据压缩技术
在科学计算领域,软件性能和数据压缩是两个至关重要的方面。本文将围绕Octopus代码的性能改进以及ZLIB替代压缩算法展开探讨,为大家揭示这些技术背后的原理和优势。
1. Octopus代码的性能提升
Octopus是基于TDDFT理论的科学软件包,在全球众多研究小组中得到了成功应用。然而,以往它主要用于分析中等规模的复杂纳米结构,为了使其能够处理更大规模的系统(数千个原子及以上),需要对代码进行改进。
1.1 时间依赖模拟的可扩展性
在BG/Q机器上进行的时间依赖模拟显示,Octopus代码的改进使得可扩展性得到了显著提升。对于不同原子数量的系统,其表现如下:
- 180原子系统 :由于内存需求的减少,该系统现在仅需4个MPI进程即可运行,并且在8k进程下仍然保持高效。
- 650原子系统 :在多达16k进程下都没有出现饱和迹象。
- 1365原子系统 :在32k处理器下具有高度并行性,甚至能够在64k处理器上运行,远远超过了以往的结果。
- 2676原子系统 :在16k处理器下几乎实现了完美的可扩展性,但由于项目的CPU配额有限,测试受到了一定限制。
在BG/P机器上进行的缩放测试也显示出了非常相似的行为。例如,650原子系统在该机器上直到最大可用CPU核心(128k)都没有饱和,180原子系统在4到64k MPI进程范围内非常高效。此外,新的高效内存使用方式使得在该机器上能够在32k处理器上运行更大的587
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



