边缘端的光速机器学习推理与低延迟、高能效的DRAM内CNN加速
1. 光学领域BNN加速器ROBIN
ROBIN是一种光学领域的BNN(二元神经网络)加速器,它通过设备级、电路级和架构级的优化,在节省能源和面积的同时提高了整体吞吐量。经过优化,ROBIN有两个变体:
- ROBIN - EO :针对能源和面积效率进行了优化。
- ROBIN - PO :以牺牲更多的功耗为代价,展现出更高的每秒帧数(FPS)性能。
1.1 性能优势
模拟分析表明,ROBIN的每比特能量消耗(EPB)性能明显优于各种最先进的光神经网络加速器。与电子BNN加速器相比,ROBIN - EO的EPB值低约4倍,与光子BNN加速器相比低约933倍。而ROBIN - PO的FPS比电子和光子BNN加速器分别好约3倍和25倍。
1.2 与CPU推理的比较
为了突出专用推理加速的优势,将ROBIN架构与标准桌面CPU(Intel i7 - 4790)在四种模型和数据集上的推理性能进行了比较,结果如下表所示:
| 模型编号 | 参数 | 数据集 | ROBIN - PO(μs) | i7 - 4790(ms) |
| ---- | ---- | ---- | ---- | ---- |
| 1 | 60,642 | Sign MNIST | 0.0218 | 0.16 |
| 2 | 1,546,570 | CIFAR10 | 0.28 | 1.75 |
| 3 | 13,570,186 | STL10 | 2.3 | 2.
超级会员免费看
订阅专栏 解锁全文
11万+

被折叠的 条评论
为什么被折叠?



