NPU、GPU的数据路径

jc小小川+幻幻融hr

已于 2024-03-22 11:26:48 修改

阅读量665

点赞数 10

分类专栏：小小川编译器文章标签： AI编程人工智能硬件架构

于 2024-03-18 19:49:18 首次发布

本文链接：https://blog.youkuaiyun.com/u012276729/article/details/136700421

版权

14 篇文章

订阅专栏

本文详细解释了NPU数据路径，涉及数据输入预处理、存储与缓存、计算与激活、中间结果存储、后处理以及输出，强调了优化数据路径对AI性能提升的重要性。同时提到了AI芯片、编译器在处理计算任务中的作用，以及计算粒度的差异。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

请描述你所知架构的数据路径，挺懵，不知到是从哪些方面说。大概

一个简化的NPU数据路径概述：

数据输入：
- 原始数据（如图像、语音、文本等）首先通过输入接口进入NPU。这些数据可能来自传感器、存储设备或其他处理器。
数据预处理：
- 在数据进入NPU进行计算之前，可能需要进行一些预处理操作，如数据格式的转换、归一化、降维等。这些操作有助于将数据转换成适合神经网络处理的形式。
存储与缓存：
- 预处理后的数据被存储在NPU内部的存储器或缓存中，以便后续的计算过程可以高效地访问这些数据。
计算与激活：
- 数据被送入NPU的计算单元（如乘加单元、激活函数单元等），在这里执行神经网络的各种数学运算和激活函数。这些计算是神经网络实现学习和推理的基础。
中间结果存储：
- 在神经网络的前向传播过程中，产生的中间结果需要被存储起来，以便在反向传播过程中使用。这些中间结果可能包括每层的输出、梯度等。
数据后处理：
- 计算完成后，得到的结果可能需要进一步的后处理，如解码、概率归一化、阈值判断等，以转换成用户可以理解或使用的形式。
结果输出：
- 最后，处理后的结果通过输出接口从NPU传输到其他系统组件或应用程序中，供进一步使用或展示。