高效稀疏CNN加速器评估与Sparse - PE核心技术解析
1. 稀疏CNN加速器评估
在FPGA - SoC上对提出的稀疏CNN加速器进行原型设计后,由于此前部分CNN加速器采用ASIC实现,或在模拟器中评估,直接与它们进行定量比较并不可行。因此,评估从两方面展开:与基于CPU的CNN推理对比,以及与先前基于FPGA的硬件加速器对比。
1.1 评估基准选择
选取SqueezeNet的6个卷积层(CONV层15、17、26、28、41和43)作为基准。这些层的配置如下表所示:
| 层 | IFM尺寸 | OFM尺寸 | 滤波器尺寸 | 滤波器数量 | 步长 | 填充 |
| — | — | — | — | — | — | — |
| 15 | 29 × 29 × 32 | 29 × 29 × 128 | 1 × 1 × 32 | 128 | 1 | 0 |
| 17 | 29 × 29 × 32 | 29 × 29 × 128 | 3 × 3 × 32 | 128 | 1 | 1 |
| 26 | 15 × 15 × 48 | 15 × 15 × 192 | 1 × 1 × 48 | 192 | 1 | 0 |
| 28 | 15 × 15 × 48 | 15 × 15 × 192 | 3 × 3 × 48 | 192 | 1 | 1 |
| 41 | 15 × 15 × 64 | 15 × 15 × 256 | 1 × 1 × 64 | 256 | 1 | 0 |
| 43 | 15 × 15 × 64 | 15 × 15 × 256 | 3 × 3 × 64 | 256 | 1 | 1 |
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



