线性系统的直接法与迭代法求解
1. 带状结构线性系统的直接法
1.1 并行计算时间分析
在并行计算带状结构线性系统时,每个处理器会与相邻处理器交换一个数据值,通信时间为:
[C_3(n, p) = 2 \cdot t_{s2s}(1)]
总计算时间为:
[T(n, p) =\left(\frac{14n}{p} + 14 \cdot \lceil\log p\rceil + \frac{5n}{p} - 4\right) \cdot t_{op} \simeq \left(\frac{19n}{p} + 14 \cdot \log p\right) \cdot t_{op}]
通信开销为:
[C(n, p) =\left(2 \cdot \frac{\log n}{p} + 2\lceil\log p\rceil\right)t_{s2s}(4) + 2 \cdot t_{s2s}(1) \simeq 2 \cdot \log n \cdot t_{s2s}(4) + 2 \cdot t_{s2s}(1)]
与顺序算法相比,并行实现会产生 14 · log p 次操作的小计算冗余。通信开销随行数呈对数增长,而计算时间呈线性增长。
1.2 带状矩阵的循环约简算法
1.2.1 算法描述
循环约简算法可推广到半带宽 r > 1 的带状矩阵。假设 (n = s \cdot r),矩阵可表示为块三对角矩阵:
[\begin{pmatrix}
B^{(0)} 1 & C^{(0)}_1 & 0 \
A^{(0)}_2 &
超级会员免费看
订阅专栏 解锁全文
721

被折叠的 条评论
为什么被折叠?



