并行矩阵乘法算法解析
1. 引言
在科学计算中,矩阵计算是众多问题的核心,而矩阵乘法更是其中最基础的计算之一。为了高效地进行矩阵乘法运算,我们将探讨四种不同的算法,其中两种适用于共享内存多处理器,另外两种适用于分布式内存系统。每种算法都展示了不同的编程技术和JR机制的组合。
2. 问题描述
要计算两个N × N的实矩阵A和B的乘积,需要为A的每一行和B的每一列的每种组合计算一个内积。在大规模并行、同步多处理器上,所有内积可以并行计算,效率较高。但在异步多处理器上,每个进程需要显式创建和销毁,且每个内积的计算量相对较小。因此,为了在异步多处理器上高效执行,并行程序中的每个进程必须执行相当多的工作,以平衡创建进程、通信和同步所需的时间。
3. 算法介绍
3.1 预调度条带算法
- 算法原理 :使用N × N的实矩阵A、B和C作为共享变量,使用PR个进程计算A和B的乘积并存储在C中。假设N是PR的倍数,为了平衡每个进程的计算量,每个进程负责计算矩阵C中一个条带的所有元素的值。例如,设S = N/PR,则第一个进程计算C的前S行的值,第二个进程计算接下来的S行的值,依此类推。这种方法称为预调度,因为每个进程预先分配了一定数量的“任务”(即内积)。
- 实现步骤 :
- 主类从输入文件或命令行读取N、PR、A和B的值,创建一个乘法器对象,并调用其compute方法进行实际计算,最后输出结果。
- 乘法器类声明N、PR、S以及矩阵A、B和C。其compute方法创建