TPU-MLIR 总览

最新推荐文章于 2025-04-16 11:52:37 发布

螺丝松掉的人

最新推荐文章于 2025-04-16 11:52:37 发布

阅读量970

点赞数 16

文章标签： mlir

本文链接：https://blog.youkuaiyun.com/m0_59551305/article/details/143888564

版权

TPU-MLIR 总览

## 项目简介：

TPU-MLIR 是 AI 芯片的 TPU 编译器工程。该工程提供了一套完整的工具链, 其可以将不同框架下预训练的神经网络, 转化为可以在算能 TPU 上高效运算的文件 bmodel。

TPU-MLIR 是基于 MLIR(Multi-Level Intermediate Representation) 的，对于 MLIR 来说，Dialect 是用于抽象分层的重要概念，是使其基础设施高度灵活、可扩展和可定制的关键机制。通过 Dialect 允许 MLIR 支持多个不同的计算模型和应用领域，每个 Dialect 都可以定义一组特定的操作、类型、属性和优化规则。MLIR官方教程中，将 Dialect 类比为 C++ 中的命名空间，这样的理解会直观很多。

TPU-MLIR 的实现就是通过定义了两种新的 Dialect：

Tensor operation (TOP) dialect，与具体的 TPU 硬件平台无关，用于对深度学习图语义进行编码，具体定义可查看 https://github.com/sophgo/tpu-mlir/blob/master/include/tpu_mlir/Dialect/Top/IR/TopOps.td
TPU kernel dialect，与具体的 TPU 硬件平台有关，用于对 TPU 提供标准的内核计算，具体定义可查看 https://github.com/sophgo/tpu-mlir/blob/master/include/tpu_mlir/Dialect/Tpu/IR/TpuOps.td

在这里插入图片描述

上图为 TPU-MLIR 的主要架构，当前支持 ONNX TFLite Caffe 格式的模型输入，其他的模型如 Pytorch, Tensorflow 可以先转换为 ONNX 格式。

框架	ONNX 支持	常见用途
PyTorch	原生支持，使用 torch.onnx.export() 导出	研究、原型开发、跨框架迁移、模型优化
TensorFlow	通过第三方工具（tf2onnx）支持	生产部署、大规模训练、跨框架迁移、硬件加速
PaddlePaddle	通过 paddle.onnx.export() 支持	工业部署、中文处理任务、跨框架迁移、硬件加速