自适应交叉近似(Adaptive Cross Approximation)技术详解
1. 引言
在电磁学的数值计算中,矩阵的存储和求解是一个关键问题。自适应交叉近似(Adaptive Cross Approximation,ACA)技术为解决这一问题提供了有效的途径。它通过对矩阵进行压缩,减少了内存需求,同时提高了计算效率。本文将详细介绍ACA技术的相关内容,包括目标组大小的选择、LU分解、矩阵系统求解以及软件实现等方面。
2. ACA目标组大小的选择
ACA中目标组大小$N_g$的选择基于多个因素:
- 避免内存需求过大 :由于ACA中对角块不进行压缩并以完整形式存储,若$N_g$过大,对角块的内存需求将过高。
- 发挥BLAS性能 :在优化的BLAS库(如Intel MKL和NVIDIA cuBLAS)中,Level 3 BLAS矩阵 - 矩阵乘积cgemm的性能随块大小增加而提升,但最终会趋于平稳。
- 保证非对角块的可压缩性 :若$N_g$过小,非对角块的可压缩性会受到影响,无法充分利用优化BLAS的潜力。
经验表明,在当前硬件上,ACA最适宜的$N_g$范围为2500到3500个未知数,这样可以平衡非对角块的压缩、对角块的存储需求以及块操作的效率。
3. ACA压缩矩阵的LU分解
3.1 单级ACA方法
在填充块矩量法(MoM)矩阵后,非对角块以压缩形式存储,需要求解矩阵系统。一种方法是对压缩后的系统矩阵应用块LU分解,此时LU矩阵的非对
超级会员免费看
订阅专栏 解锁全文
1696

被折叠的 条评论
为什么被折叠?



