论文笔记 -- ACM FPGA 2019 Reconfigurable Convolutional Kernels for Neural Networks on FPGAs

Reconfigurable Convolutional Kernels for Neural Networks on FPGAs -2019 ACM FPGA

@(论文笔记)

reconfgurable constant multipliers (RCMs) showed that

  1. RCMs use considerably fewer resources compared to logic-based multipliers and
  2. the reconfguration of the coefcients is possible within very few clock cycles
    最新的RCM 使用CFG-LUT, 可以在32个周期内进行重载

本文的主要贡献:

  1. 本文设计了一种变体KCM(Ken Chapman.‘s Multiplier / Constant coefficient Multipliers)。使用快速可编程查找表,流水线加法树,faithfor rounding ,以及一种使用CFGLUT的在线可编程电路
  2. 本文设计了一种基于FloPoCo代码生成器的自动脚本。
    FloPoCo (Floating-Point Cores) 是一种将算法公式(C,C++)自动转换为VHDL的工具。有点类似HLS.
    http://flopoco.gforge.inria.fr/

CNN core的设计

1、Generic LUT-based Constant Multiplication (Ken Chapman.‘s Multiplier (KCM))

x是原码,等号后面的表示补码到原码的转换。 例如 x=-3,其三位补码表示的x为(101),则有$-3 = -2^2+2^0$。 将x与Cn($B_c$比特)相乘,可以将乘法分解为若干个小的乘法,每个都是$B_c\times L$。

K = [ B i / L ] K = [B_i/L] K=[Bi/L] 当Bi不能被L整除时,需要将Bi扩展。
所使用的KCM乘法器结构如下:其中,只有第一个计算Bi-1到Bi-L-2部分的乘法器是signed,其余都是unsigned.

2、Compressor Trees

上图中最后的求和部分可以使用加法树实现。本文指出,传统的加法树是基于全加器和半加器设计的,在FPGA上映射到LUT上是十分低效的。因此本文使用Parandeh-Afshar提出的 generalized parallel counters (GPCs)。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

love小酒窝

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值