有限元求解器中稀疏矩阵组装优化及3D有限元方法应用在CUDA上的实现与评估
1. 有限元求解器中稀疏矩阵组装优化
在有限元求解器中,对稀疏矩阵组装进行优化是提升性能的关键。研究人员探究了使用单边通信优化有限元求解器的可行性。结果表明,从传统的消息传递稀疏矩阵组装切换到使用PGAS编程模型的单边通信,可以获得显著的加速效果。开发混合MPI/PGAS应用程序的方法也证明,无需重写整个应用程序,就可以使用PGAS进一步优化旧的遗留代码。
1.1 基准测试结果
下面是不同基准测试的组装时间和插入率数据:
| 基准测试 | 核心数 | PETSc组装时间(秒) | JANPACK组装时间(秒) | PETSc插入率(Mega条目/秒) | JANPACK插入率(Mega条目/秒) |
| ---- | ---- | ---- | ---- | ---- | ---- |
| Benchmark A | 384 | 1.420 | 1.050 | 9.31 | 12.6 |
| Benchmark A | 768 | 0.772 | 0.547 | 8.56 | 12.1 |
| Benchmark A | 1536 | 0.429 | 0.285 | 7.70 | 11.6 |
| Benchmark A | 3072 | 0.268 | 0.150 | 6.16 | 11.0 |
| Benchmark A | 6144 | 0.200 | 0.086 | 4.13 | 9.60 |
| Benchmark A | 12288 | 0.194 | 0.050 | 2.13 | 8.26 |
|
超级会员免费看
订阅专栏 解锁全文
1430

被折叠的 条评论
为什么被折叠?



