高性能计算在多相流与电子结构计算中的应用
1. 多相可压缩流的高性能 CPU 内核
在多相可压缩流的模拟中,开发高效的 CPU 内核至关重要。研究人员开发了适用于多相可压缩流的高效 CPU 内核,并使用屋顶线模型进行了先验分析,以估计可达到的最大性能。
1.1 模拟性能分析
对于 SBI(Shock-Bubble Interaction)模拟,在 Magny - Cours 上单个时间步花费的时间为 2.9 秒,其中 98% 的时间花在 RHS 内核上,1% 花在更新和 dt 内核上,这进一步证明了在 RHS 内核上投入精力的合理性。
1.2 高性能模拟软件
研究人员展示了一款针对最先进多核处理器的多相可压缩流高性能均匀分辨率模拟软件,该软件在考虑的平台上能够达到峰值性能的 48%。这一结果在共享内存架构的可压缩流模拟软件中达到了最高比例,比目前被认为是最先进的结果高出 9 - 14 倍。
1.3 核心层优化效果
在核心层,优化技术带来的性能提升比基线 C++ 实现提高了一个数量级。此外,所有测量结果都在屋顶线模型预测的性能范围内。在 Magny - Cours 上,48 个核心实现了 40 - 45 倍的加速,达到 360 GFLOP/s,相当于峰值性能的 42%;在单插槽 Sandy Bridge 平台的 4 个核心上实现了 3.7 倍的加速。
1.4 优化技术的适用性
由于当前求解器基于块的性质,所考虑的优化技术也适用于其他框架,如 AMR(Adaptive Mesh Refinement)。这些技术目前正在应用于基于小波的自适应求解器,用
超级会员免费看
订阅专栏 解锁全文
957

被折叠的 条评论
为什么被折叠?



