11、并行矩阵乘法算法详解

sre5engineer

于 2025-08-12 14:46:16 发布

阅读量71

点赞数

CC 4.0 BY-SA版权

分类专栏：探索JR：并发编程的新篇章文章标签：并行计算矩阵乘法预调度条带算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/sre5engineer/article/details/150522155

探索JR：并发编程的新篇章专栏收录该内容

18 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

并行矩阵乘法算法详解

1. 引言

矩阵计算在大多数科学计算问题中处于核心地位，而矩阵乘法是其中最基本的计算之一。为了高效地进行矩阵乘法，我们将介绍四种不同的算法，其中两种使用共享变量，适用于共享内存多处理器；另外两种使用消息传递，适用于分布式内存系统。

2. 并行计算的关键考量——粒度大小

在异步多处理器上高效执行并行程序时，每个进程执行的工作量相对于创建进程的时间以及与其他进程通信和同步的时间要足够大。通常用并行计算的基本步骤（粒度）来描述进程执行的顺序工作量。选择合适的粒度大小是并行计算中普遍且重要的问题，因为粒度大小决定了每个进程的顺序执行时间，该时间必须远大于并发和通信开销。

3. 预调度条带算法

算法原理 ：使用 $N × N$ 的实矩阵 $A$、$B$ 和 $C$，假设它们是共享变量，使用 $PR$ 个进程来计算 $A$ 和 $B$ 的乘积并存储在 $C$ 中。为了平衡每个进程的计算量，假设 $N$ 是 $PR$ 的倍数，令 $S = N/PR$，第一个进程计算 $C$ 的前 $S$ 行的值，第二个进程计算接下来的 $S$ 行的值，依此类推。这种方法有时被称为预调度，因为每个进程预先被分配了一定数量的“任务”（即这里的内积）。
实现步骤 ：
1. 主类从输入文件或命令行读取 $N$、$PR$、$A$ 和 $B$ 的值，创建一个乘法器对象，调用其 compute 方法进行实际计算，并输出结果。
2. 乘法器类声明 $N$、$PR$、$

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符 | 博主筛选后可见

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。