快速性能估计与低延迟FPGA神经元模型实现
1. 快速性能估计在设计空间探索(DSE)中的应用
在设计空间探索(DSE)中,快速且具有足够保真度的性能估计至关重要。可重定向源级分析是一种很有前景的方法,它通过对规格进行一次分析来确定其计算需求,然后通过规格计算需求和捕获处理元素(PE)计算能力的权重表进行矩阵乘法,就能简单地估计应用程序的执行时间。
不过,这种方法严重依赖于权重表的质量和可用性。为了解决这个问题,提出了一种基于校准的框架,用于自动确定处理器的权重表。该框架避免了手动捕获处理器特性(执行时间)这一容易出错的过程,还缓解了源级分析可见性有限以及将不可见特性归因于已考虑操作的挑战。
为了验证该方法并分析其边界,设计了一个合成模型。在ARM9和Blackfin BF527处理器上使用49个基准测试(主要是MiBench和DSP Stone),并考虑了内存配置(SRAM和SDRAM)和软件优化(O0、O1、O2和O3)来测量WeiCal的效率。在3.1 GHz i5 - 3450 Intel主机的单核心上,使用权重表方法每秒可以进行2500万次估计,平均估计误差为24%。在性能差距较大的情况下,该方法具有更高的保真度,例如在比较ARM0在O0与其他优化时,保真度可超过94%。这种高估计速度和良好的保真度使该方法成为自动化DSE的理想基石。
2. Izhikevich神经元模型的FPGA低延迟实现
2.1 背景与动机
人脑约有$10^{11}$个神经元,每个神经元可以与其他神经元形成超过$10^{4}$个突触连接。大脑是目前已知最具启发性和强大的计算机器,其计算能力源于三个层面的复杂性:可适应细胞(神经元)的
超级会员免费看
订阅专栏 解锁全文
1706

被折叠的 条评论
为什么被折叠?



