二维脉动阵列的矩阵乘法

二维脉动阵列实现高效矩阵乘法

最新推荐文章于 2025-08-10 09:06:27 发布

原创

最新推荐文章于 2025-08-10 09:06:27 发布 · 6.8k 阅读

46 ·

CC 4.0 BY-SA版权

本文为博主原创文章，如需转载请注明出处。

文章标签：

#脉动阵列 #矩阵乘法 #硬件算法 #Systolic Array

本文介绍了二维脉动阵列（Systolic Array）在矩阵乘法中的应用，通过展示如何让数据在处理元件阵列中流动，减少内存访问，提高运算效率。内容包括二维矩阵的概念，脉动阵列的实现方法，其特点以及性能评估。

脉动阵列

脉动阵列（Systolic Array）是H. T. Kung在1982年提出的¹,一种由众多简单的PE（Processing Element，处理元件）按规则排列的硬件架构，本身的核心概念是让数据在运算单元的阵列中进行流动，减少访存的次数，并且使得结构更加规整，布线更加统一，提高频率。

1. 二维矩阵

例子 $X * W = Y$
$\left[ \begin{matrix} X_{11} & X_{12} & X_{13} & X_{14} \\ X_{21} & X_{22} & X_{23} & X_{24} \\ X_{31} & X_{32} & X_{33} & X_{34} \\ X_{41} & X_{42} & X_{43} & X_{44} \\ \end{matrix}\right] * \left[ \begin{matrix} W_{11} & W_{12} & W_{13} & W_{14} \\ W_{21} & W_{22} & W_{23} & W_{24} \\ W_{31} & W_{32} & W_{33} & W_{34} \\ W_{41} & W_{42} & W_{43} & W_{44} \\ \end{matrix}\right] = \left[ \begin{matrix} Y_{11} & Y_{12} & Y_{13} & Y_{14} \\ Y_{21} & Y_{22} & Y_{23} & Y_{24} \\ Y_{31} & Y_{32} & Y_{33} & Y_{34} \\ Y_{41} & Y_{42} & Y_{43} & Y_{44} \\ \end{matrix}\right]$