NPU的设计逻辑

原创已于 2022-09-29 11:11:23 修改 · 1.6k 阅读

9 ·

CC 4.0 BY-SA版权

文章标签：

#深度学习 #fpga开发 #神经网络

于 2021-12-20 17:21:00 首次发布

嵌入式系统同时被 3 个专栏收录

353 篇文章

订阅专栏

Linux

216 篇文章

订阅专栏

人工智能

155 篇文章

订阅专栏

本文探讨了NPU（神经处理单元）的设计，其数学模型基于高维空间坐标向量的仿射变换。内容涉及IP核心的可配置参数，如位宽、层数和神经元数，并详细阐述了权重内存地址宽度的计算方法。文章还提到了权重内存的访问策略，以及神经网络结构的基本原理。OpenC906社区的专家提供了有关设计思路的解答。

部署运行你感兴趣的模型镜像

NPU设计的数学模型比较简单，可以看成是对高维空间坐标向量进行一次仿射变换，公式如下图中的样子：

这份ANN IP实现包含两个部分，ANN 核心实现和ANN封装实现，封装实现的作用是可以将ANN的核心实现逻辑与不同的SOC系统总线对接，当前有实现和AXI4对接的wrapper实现。

IP核心是可以通过参数进行配置的，包括位宽，层数，输入维度，以及各层的神经元数，根据输入和输出并行、串行方式的不同，可以将各层分为三种类型，分别是"SP","PS","PP",当前的实现还不支持PP。当前的实现，数据操作是按照定点格式进行，目的是为了在有限的IP面积上使性能最大化。

可配置参数如下表所示：

输入层适合SP，输出层适合PS

不同的属性层之间需要串并转换和并串转换：

关于权重内存访问很有意思，首先定义的是权重内存地址的宽度，它的定义很有意思,我们可以这样理解，整个地址可以分解成几个部分，分别是，表示层号的 $[len-1, len - log_2(Nlayer)]$ 这部分可以索不同的层，宽度是 $log_2(Nlayer )$ 。接着是表示索引偏置还是权重的bias_select，它宽度只有1位，身下的位则是索引某层内部的数据了。它的宽度计算很有意思，用文字表达分成两步。