稀疏CNN加速器的最新进展与原位解压缩卷积加速器设计
1. 矩阵乘法方法概述
在矩阵乘法领域,有几种不同的方法,包括基于内积、外积和行积的方法,它们各有特点和优势。
-
行积矩阵乘法的优势
- 无需进行索引匹配。
- 不需要用于存储部分结果的大量片上内存。
- 不需要按列访问操作数矩阵,有利于利用局部性。
-
内积和外积矩阵乘法架构对比
| 乘法类型 | 操作步骤 | 特点 |
| ---- | ---- | ---- |
| 内积矩阵乘法 | 乘法前进行索引匹配以去除无效操作(与零值操作数相乘),将非零索引匹配的值相乘并累加生成输出矩阵元素 | 直观但需要索引匹配,不利于低成本硬件设计和实现 |
| 外积矩阵乘法 | 将矩阵A某列的操作数多播到矩阵B某行的操作数,相乘后通过矩阵合并器累加部分矩阵生成部分矩阵(或多个部分矩阵) | 通常需要大量存储来存储部分结果矩阵 |
下面是一个简单的mermaid流程图,展示内积和外积矩阵乘法的基本流程:
graph LR
classDef startend fill:#F5EBFF,stroke:#BE8FED,stroke-width:2px
classDef process fill:#E5F6FF,stroke:#73A6FF,stroke-
超级会员免费看
订阅专栏 解锁全文
588

被折叠的 条评论
为什么被折叠?



