GPU加速CFD求解器异步日志内核优化与约束气动外形优化
在计算流体动力学(CFD)领域,优化求解器的性能一直是研究的重点。本文将介绍两方面的研究内容,一是GPU加速CFD求解器异步日志内核的优化,二是使用神经网络和顺序采样的约束气动外形优化。
GPU加速CFD求解器异步日志内核优化
在之前工作的基础上,研究人员对CFD求解器FaSTAR中异步日志内核的GPU执行进行了改进。通过在日志内核执行中实现混合精度,降低了内存开销。具体做法是减少了它们所处理数组的浮点精度。
精度对结果的影响
将单精度或半精度与参考同步计算进行比较,结果几乎无法区分。进一步分析发现,单精度和半精度的残差略低于参考结果,这是因为它们都是用单精度计算的。在异步执行使用半精度时,部分值被替换为+∞,但总体来说,计算残差时使用降低精度并未影响解的质量。单精度下日志文件的质量几乎相同,半精度在大多数情况下也能得到几乎相同的结果,但有些值无法表示。
性能分析
- 加速比 :定义加速比η为时间积分循环中花费的壁钟时间之比,即$\eta = \frac{t_{sync}}{t_{async}}$,其中$t_{sync}$与参考同步执行相关,$t_{async}$与不同实现的异步执行相关。
- 随着单元数量的增加,加速比总体呈下降趋势。因为单元数量增加时,可饱和的空闲线程减少,异步执行效率降低。
- 不同精度的加速比范围不同,1个域的加速比为1.15 - 1.21,2个域为1.15 - 1.25,4个域为1.17 - 1.27。4个域的计算加速比变化更混乱,