特定领域加速器:自动机、图与数据库处理技术
1. 自动机处理
1.1 性能提升挑战与方案
自动机处理在移植时可能会出现显著的减速问题,最高可达 46 倍。为克服这一局限,研究人员提出了软件转换和硬件扩展方案,如报告聚合和报告排队,以提高 I/O 带宽利用率。
由于单个 AP 设备仅支持 48K 状态,Liu 等人将大型 NFA 划分为热状态和冷状态,减少重新配置 AP 的开销。通过将大部分 AP 资源用于执行热状态的转换,相比基线 AP 实现了 2.1 倍的加速。Subramaniyan 等人则提出低成本扩展,打破 AP 对单个输入流的顺序处理瓶颈,支持枚举并行化。通过终止 NFA 中不活跃或已收敛的枚举路径,使枚举成为可能。
1.2 利用其他内存基板
近年来,一些研究展示了 SRAM、eDRAM 和 ReRAM 等其他内存技术加速自动机处理的潜力。例如,Micron 的自动机处理器在较低技术的 DRAM 节点上实现路由矩阵,占用了大量芯片面积,且物理 DRAM 容量相对较小。而 Subramaniyan 等人发现,基于 SRAM 的高速缓存可将自动机处理加速 9 - 15 倍。
为克服空间内存中心自动机处理架构 8 位固定符号处理的限制,Sadredini 等人提出了多种解决方案。他们通过每个周期处理多个 4 位符号,提高状态匹配资源的利用率;提出自动机编译器,实现任意位宽处理;还观察到全交叉开关在许多实际 NFA 中过度配置,提出基于简化交叉开关的互连,提高状态转换的面积效率。
1.3 自动机处理总结
以内存为中心的自动机处理架构,如 Micron 的 AP,利用
超级会员免费看
订阅专栏 解锁全文
706

被折叠的 条评论
为什么被折叠?



