Phantom与Phantom - 2D:稀疏CNN高性能计算核心解析
1. Phantom核心组件解析
1.1 计算引擎(Compute Engine)
计算引擎是Phantom核心的重要组成部分,以PE0为例,它包含多个线程(th2,0、th1,0、th0,0),并且有对应的配置位(Config bits)。在不同的周期(1st cycle、2nd cycle、3rd cycle)进行计算操作,如加法(Add)。在计算过程中,会涉及到各种映射(map)和权重(wa、wb、wc等)的运算。例如,在第一个周期,会对不同的输入和权重进行组合计算。
1.2 输出缓冲区(Output Buffer)
输出缓冲区(OB)是Phantom核心的最后一个模块,它负责缓冲计算引擎(CE)的输出,并使用L2加法器对数据进行累加以生成最终输出。缓冲操作通过m个先进先出(FIFO)缓冲区系统完成,其中m等于CE中乘法器线程的总数(这里是9)。
| FIFO编号 | 接收数据 | 标签位 |
|---|---|---|
| F1 | d2wa2 | (1) |
| F2 | a1wa1 + a2wa2 | (1) |
| F3 | e1wa + e2w2 |
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



