23、快速性能估计与低延迟FPGA神经元模型实现

快速性能估计与低延迟FPGA神经元模型实现

1. 快速性能估计在设计空间探索(DSE)中的应用

在设计空间探索(DSE)中,快速且具有足够保真度的性能估计至关重要。可重定向源级分析是一种很有前景的方法,它通过对规格进行一次分析来确定其计算需求,然后通过规格计算需求和捕获处理元素(PE)计算能力的权重表进行矩阵乘法,就能简单地估计应用程序的执行时间。

不过,这种方法严重依赖于权重表的质量和可用性。为了解决这个问题,提出了一种基于校准的框架,用于自动确定处理器的权重表。该框架避免了手动捕获处理器特性(执行时间)这一容易出错的过程,还缓解了源级分析可见性有限以及将不可见特性归因于已考虑操作的挑战。

为了验证该方法并分析其边界,设计了一个合成模型。在ARM9和Blackfin BF527处理器上使用49个基准测试(主要是MiBench和DSP Stone),并考虑了内存配置(SRAM和SDRAM)和软件优化(O0、O1、O2和O3)来测量WeiCal的效率。在3.1 GHz i5 - 3450 Intel主机的单核心上,使用权重表方法每秒可以进行2500万次估计,平均估计误差为24%。在性能差距较大的情况下,该方法具有更高的保真度,例如在比较ARM0在O0与其他优化时,保真度可超过94%。这种高估计速度和良好的保真度使该方法成为自动化DSE的理想基石。

2. Izhikevich神经元模型的FPGA低延迟实现
2.1 背景与动机

人脑约有$10^{11}$个神经元,每个神经元可以与其他神经元形成超过$10^{4}$个突触连接。大脑是目前已知最具启发性和强大的计算机器,其计算能力源于三个层面的复杂性:可适应细胞(神经元)的

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值