【tvm官网教程01】设计和架构-2-runtime

最新推荐文章于 2025-11-18 09:49:57 发布

原创

最新推荐文章于 2025-11-18 09:49:57 发布 · 1.2k 阅读

4 ·

CC 4.0 BY-SA版权

本文介绍了TVM的runtime系统，包括PackedFunc用于跨语言调用，Module封装编译对象，远程部署机制，以及TVM object在编译器栈中的作用。PackedFunc通过TVMArgs和TVMRetValue实现类型擦除，方便在不同语言间交互。Module抽象了设备驱动，支持动态获取和执行编译后的函数。远程部署利用RPCModule实现数据迁移和计算启动。

1. runtime系统

TVM支持多种编程语言用于编译栈的开发和部署。
在这里插入图片描述
runtime需要解决的难题有：
部署：从python / javascript / c ++语言调用已编译的函数。
调试：在python中定义一个函数，然后从已编译的函数中调用该函数。
链接：编写驱动代码以调用device专用代码（如CUDA），然后从已编译的host函数中调用它。
原型：从python定义一个IR pass，并从C ++后端调用它。
开放：使用C ++开发的编译器栈到前端（例如python）
实验：将已编译的函数运送到嵌入式设备以在其中直接运行。

TVM希望能够用任意语言定义函数，并用另一种语言调用。TVM还希望最小化运行时core以将其部署到嵌入式设备。

1.1 PackedFunc

PackedFunc是上述问题的一个简单但优雅的解决方案。

python调c++

#include <tvm/runtime/packed_func.h>

void MyAdd(TVMArgs args, TVMRetValue* rv) {
   
   
  // automatically convert arguments to desired type.
  int a = args[0];
  int b = args[1];
  // automatically assign value return to rv
  *rv = a + b;
}

void CallPacked() {
   
   
  PackedFunc myadd = PackedFunc(MyAdd);
  // get back 3
  int c = myadd(1, 2);
}

MyAdd是type-erased的，它并没有指定输入、输出数据类型。
在调用myadd时，PackedFunc将入参打包到TVMArgs，再从TVMRetValue中取出返回值。
以上设计，得益于c++的模板机制。

由于它具有类型擦除的特性，因此我们可以从动态语言（如python）调用PackedFunc：

// register a global packed function in c++
TVM_REGISTER_GLOBAL("myadd")
.set_body(MyAdd);

import tvm

myadd = tvm.get_global_func("myadd") # python
print(myadd(1

最低0.47元/天解锁文章