17、稀疏卷积神经网络加速器:Sparse - PE与Phantom的技术解析

稀疏卷积神经网络加速器:Sparse - PE与Phantom的技术解析

1. Sparse - PE加速器的实现与结果

在低激活稀疏度的情况下,CSC格式在稀疏VGG16和Mobilenet中,其DRAM内存访问量分别约为稀疏掩码的4倍和3.7倍。在具有中高稀疏度的深层中,CSC格式的内存需求约为稀疏掩码的1.7倍。这表明稀疏二进制掩码格式不仅需要较少的编码/解码逻辑,而且在内存需求方面比CSC格式更高效,这直接为采用稀疏二进制掩码的加速器带来了更高的能源、面积和计算节省。

1.1 RTL实现

采用Xilinx Z - 7100 SoC来实现Sparse - PE核心设计。该SoC分为两部分:可编程逻辑(PL),包含FPGA结构;处理系统(PS),包含ARM内核。两者通过AXI片上通信子系统连接。将Sparse - PE核心实现在PL上,并使用PS在台式计算机和PL之间传输数据。测试设计针对Sparse - PE - 27配置实现,运行频率为200 MHz。

属性 可用资源 已使用资源 利用率(%)
LUTs 277k 3.4k 1.23%
FFs 554k 6k 1.1%
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值