TVM（端到端深度学习编译器）简介

最新推荐文章于 2025-09-11 04:38:14 发布

原创

最新推荐文章于 2025-09-11 04:38:14 发布 · 1.6w 阅读

·

27

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#深度学习 #机器学习 #编译器

TVM是一个深度学习编译器，通过TensorExpression和Schedule实现跨平台的代码优化。它解决了不同硬件需要特定计算库的问题，提供了一种统一的优化方法。TVM利用机器学习进行程序优化，包括算子融合、布局转换、矩阵乘法优化等，以提升性能。此外，TVM支持自定义硬件如VTA，并能够针对TPU等张量处理器设计搜索空间，实现高效的硬件利用率。

前言

深度学习high level已经内卷，
那么深度学习+编译器呢？

在此向陈天奇大佬致敬。

注：本文为博主的学习笔记，所用的图都是截取的，侵权联系删。

TVM

出现背景

传统深度学习框架：
在这里插入图片描述
对上图的补充说明：

Graph IR：几层的Conv2d, Relu
Operators: 比如矩阵乘法

TVM栈如下图：
在这里插入图片描述

把Operators换成了Tensor Expr, 生成代码后交给LLVM,CUDA编译器。即，通过编译的方式去解决，优点是通用性强，可部署到任何有编译器的环境中（比如手机、汽车）。

AutoTVM：是learning based optimization, 用机器学习去优化的ML编译器

在这里插入图片描述
有了Tensor Expression, TVM会去声明一个计算应该怎么做，然后再通过Schedule调度优化，之后就可以得到结果。
因此不依赖于计算库。
当有新算子时，对于TVM只是新加了Schedule，对此新算子进行适配对于TVM而言很高效。

TVM是什么

深度学习代码自动生成方法，自动的为各种硬件生成可部署的优化代码。

TVM是由华盛顿大学在读博士陈天奇等人提出的深度学习自动代码生成方法，该技术能自动为大多数计算硬件生成可部署优化代码，其性能可与当前最优的供应商提供的优化计算库相比，且可以适应新型专用加速器后端

TVM：End to End learning-based deep learning compiler

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。