稀疏卷积神经网络加速器的评估与创新设计
1. 评估背景与基准选择
在评估稀疏卷积神经网络(CNN)加速器时,由于先前提出的许多CNN加速器实现方式不同,如有些采用专用集成电路(ASIC),有些在模拟器中评估,直接与它们进行定量比较并不可行。因此,我们选择以基于CPU(使用Darknet框架,时钟频率为1.2 GHz的单核心执行)的CNN推理作为基准,仅比较卷积(CONV)层的执行时间。选择单核心CPU执行作为基准,是因为该技术的主要目标是资源受限的系统,如物联网(IoT)设备常因资源和功耗限制使用单核心CPU。
为了评估,我们选择了SqueezeNet中的6个卷积层(CONV层15、17、26、28、41和43),其配置如下表所示:
| 层 | IFM大小 | OFM大小 | 滤波器大小 | 滤波器数量 | 步长 | 填充 |
|---|---|---|---|---|---|---|
| 层15 | 29 × 29 × 32 | 29 × 29 × 128 | 1 × 1 × 32 | 128 | 1 | 0 |
| 层17 | 29 × 29 × 32 | 29 × 29 × 128 | 3 × |
超级会员免费看
订阅专栏 解锁全文
5万+

被折叠的 条评论
为什么被折叠?



