Optimizing FPGA-based Accelerator Design for Deep Convolutional Neural Networks ,2015 论文阅读笔记
这篇文章的贡献在于对CNN FPGA加速器的技术 (例如循环平铺和转换)优化,同时进行了定量分析计算吞吐量和片内外I/0带宽和建模通过roof-line模型搜索加速器硬件参数设计空间中最优的方案,最后通过此建模方案设计了一个加速器,获得当时最优性能密度的CNN加速器。我个人读了之后觉得其值得学习亮点如下:利用polyhedral-based 数据依赖分析方法来优化现有常用的加速器技术(Tiling、Unroll、pipeline和loop transformation)
原创
2022-12-01 16:21:06 ·
1098 阅读 ·
0 评论