【MMDeploy&MMPose】手把手教你在Windows上使用MMDeploy1.x进行ONNX和TensorRT的部署（Python篇）

原创

已于 2023-09-08 11:13:51 修改 · 4.7k 阅读

33 ·

CC 4.0 BY-SA版权

文章标签：

#深度学习 #pytorch #人工智能

于 2023-05-04 20:46:22 首次发布

2023.9.8更新

C++ SDK篇已经发布，点击这里传送到文章

MMDeploy 提供了一系列工具，帮助我们更轻松的将 OpenMMLab 下的算法部署到各种设备与平台上。

1.流程简介

MMDeploy 定义的模型部署流程，这里直接使用了官方文档的内容，如下图所示：

1）模型转换（Model Converter）

模型转换的主要功能是把输入的模型格式，转换为目标设备的推理引擎所要求的模型格式。

目前，MMDeploy 可以把 PyTorch 模型转换为 ONNX、TorchScript 等和设备无关的 IR 模型。也可以将 ONNX 模型转换为推理后端模型。两者相结合，可实现端到端的模型转换，也就是从训练端到生产端的一键式部署。

2）MMDeploy 模型（MMDeploy Model）

也称 SDK Model。它是模型转换结果的集合。不仅包括后端模型，还包括模型的元信息。这些信息将用于推理 SDK 中。

3）推理 SDK（Inference SDK）

封装了模型的前处理、网络推理和后处理过程。对外提供多语言的模型推理接口。

2.MMDeploy安装及环境配置

本篇文章安装环境

i5-7400HQ+1050ti
Win 11
VS2022
CUDA11.6及相应版本的cudnn（cudnn必须要）
python 3.8
pytorch 1.13.1
以及mmlab（mmcv 2.0及以上版本）基本的配置，请参考我的上一篇文章安装。

本篇文章使用mmpose1.x进行部署，起一个抛砖引玉的作用，只要是openMMLab系列的其实流程都大差不差。废话不多说了，下面正式开始：

1）mmdeploy安装

因为是在windows平台，官方建议的是使用预编译包，所以这里我们使用pip直接安装：

# 1. 安装 MMDeploy 模型转换工具（含trt/ort自定义算子）
pip install mmdeploy==1.0.0

# 2. 安装 MMDeploy SDK推理工具
# 根据是否需要GPU推理可任选其一进行下载安装
# 2.1 支持 onnxruntime 推理
pip install mmdeploy-runtime==1.0.0
# 2.2 支持 onnxruntime-gpu tensorrt 推理
pi

最低0.47元/天解锁文章

60 条评论

weixin_44389369 2025.01.03
TypeError: _jit_pass_merge_shape_concate(): incompatible function arguments. The following argument types are supported: 1. (graph: torch::jit::Graph) -> None Invoked with: graph(%input : Float(1, 30, 3, 32, 256, 256, strides=[188743680, 6291456, 1, 196608, 768, 3], requires_grad=0, device=cpu), %backbone.slow_path.conv1_lateral.conv.weight : Float(16, 8, 5, 1, 1, strides=[40, 5, 1, 1, 1], requires_grad=1, device=cpu), %backbone.slow_path.layer1_lateral.conv.weight : Float(16, 8, 5, 1, 1, strides=[40, 5, 1, 1, 1], requires_grad=1, device=cpu), %backbone.slow_path.layer2_lateral.conv.weight : Float(32, 16, 5, 1, 1, strides=[80, 5, 1, 1, 1], requires_grad=1, device=cpu), %backbone.slow_path.layer3_lateral.conv.weight : Float(64, 32, 5, 1, 1, strides=[160, 5, 1, 1, 1], requires_grad=1, device=cpu) 能帮我看看这是什么错误吗，用的是mmaction2中的slowfast模型
- weixin_44389369回复weixin_44389369 2025.01.03
  01/03 20:29:07 - mmengine - ERROR - G:\project\py\myMmdeploy\mmdeploy\mmdeploy\apis\core\pipeline_manager.py - __call__ - 94 - Start pipeline mmdeploy.apis.pytorch2onnx.torch2onnx in subprocess 01/03 20:29:20 - mmengine - WARNING - Failed to search registry with scope "mmaction" in the "Codebases" registry tree. As a workaround, the current "Codebases" registry in "mmdeploy" is used to build instance. This may cause unexpected failure when running the built modules. Please check whether "mmaction" is a correct scope, or whether the registry is initialized. 01/03 20:29:20 - mmengine - WARNING - Failed to search registry with scope "mmaction" in the "mmaction_tasks" registry tree. As a workaround, the current "mmaction_tasks" registry in "mmdeploy" is used to build instance. This may cause unexpected failure when running the built modules. Please check whether "mmaction" is a correct scope, or whether the registry is initialized. 这是一开始运行的报错

吱吱吱021 2024.12.31
博主你好，这个是问什么呢？ UserWarning: The exported ONNX model failed ONNX shape inference. The model will not be executable by the ONNX Runtime. If this is unintended and you believe there is a bug, please report an issue at https://github.com/pytorch/pytorch/issues. Error reported by strict ONNX shape inference: [ShapeInferenceError] (op_type:Where, node name: /Where_11): Y has inconsistent type tensor(float) (Triggered internally at C:\cb\pytorch_1000000000000\work\torch\csrc\jit\serialization\export.cpp:1421.) _C._check_onnx_proto(proto) The given version [15] is not supported, only version 1 to 8 is supported in this build.
- 吱吱吱021回复K.K.U 2025.01.03
  👌🏻了，谢谢[face]emoji:008.png[/face]
- K.K.U回复吱吱吱021 2025.01.01
  onnx模型版本太高了吧

不会敲代码的人 2024.07.18
博主，您好，为啥我用预训练的模型权重预测样本效果蛮好，但是pytorch转换成onnx进行推理样本图片，效果很差，然后转换过程中有WARNING: The shape inference of prim::Constant type is missing, so it may result in wrong shape inference for the exported graph. Please consider adding it in symbolic function.
- 不会敲代码的人回复K.K.U 2024.07.30
  加了，先加的目标检测detector，后加入的pose_estimator，先进行目标框的检测，再针对目标框内的关键点进行检测，我用的B站up主子豪的代码，跟着做的
- K.K.U回复不会敲代码的人 2024.07.26
  那你的onnx模型加detector了吗，就算你识别的不是人，那rtmpose也只能识别单目标/单动物的图像啊.....
- 不会敲代码的人回复K.K.U 2024.07.25
  这句话不是很理解，我再检查检查，rtmdet转换onnx对样本的预测跟之前训练完预测效果相差无几
- 不会敲代码的人回复K.K.U 2024.07.25
  您好，我使用的不是单人图像也不是多人图像，是使用的动物关键点检测的相关图像，rtmpose的训练结束对样本进行预测效果挺不错的，就是使用mmdeploy然后转换onnx之后进行预测就差别很大，现在还没找到原因，不过还是谢谢您！
- K.K.U回复不会敲代码的人 2024.07.19
  还有就是看看ONNX custom ops这一项是不是可以状态，文中有提到，使用check env可以查看
- K.K.U回复不会敲代码的人 2024.07.19
  rtmpose的onnx转换好像文中已经转换并测试过了吧，当时我跑起来是没什么问题的，效果很差看看是不是你的输入图像，是不是输入了多人图像？建议先用文中使用的图片试试效果哦
- 不会敲代码的人回复K.K.U 2024.07.18
  谢谢您的回复，但不是很通透，我是将pytorch转onnx，mmdet可以，也没什么问题，但是mmpose的rtmpose转换就报上面的warning能转换成功就是效果很差...
- K.K.U回复不会敲代码的人 2024.07.18
  大概是有ONNX不支持的算子吧

shop_keeper 2024.02.27
非常感谢博主，在我的3060笔记本上跑的速度和博主的基本一致。但是现在遇到一个问题，我在尝试对视频进行推理的时候，把model_inputs, _ = task_processor.create_input(img, input_shape)这段代码放到了循环当中，尝试对每一帧的图片都进行处理，结果Overall average从246items/s骤降到33items/s，请问有什么好的解决方法吗？
- K.K.U回复shop_keeper 2024.07.18
  考虑多线程处理，读取视频的线程和推理线程分开
- shop_keeper回复shop_keeper 2024.02.27
  还有一点就是，我发现用cv2来读取视频有很大的延迟，即使只是单纯地在for循环里读取视频而不做任何处理，也会导致fps从240+掉到160左右，请问有别的更好的方法吗

shop_keeper 2024.01.08
推理的时候报错： [code=javascript] File "D:\Python\Anaconda3\envs\paper\lib\site-packages\torch\nn\modules\module.py", line 1518, in _wrapped_call_impl return self._call_impl(*args, **kwargs) File "D:\Python\Anaconda3\envs\paper\lib\site-packages\torch\nn\modules\module.py", line 1527, in _call_impl return forward_call(*args, **kwargs) File "D:\Python\Anaconda3\envs\paper\lib\site-packages\mmdeploy\codebase\mmpose\deploy\pose_detection_model.py", line 114, in forward results = self.pack_result(preds, data_samples) File "D:\Python\Anaconda3\envs\paper\lib\site-packages\mmdeploy\codebase\mmpose\deploy\pose_detection_model.py", line 148, in pack_result bbox_centers = gt_instances.bbox_centers AttributeError: 'InstanceData' object has no attribute 'bbox_centers' [/code] 请问应该如何解决呢？
- 不会敲代码的人回复shop_keeper 2024.07.18
  对，这个坑我踩了好久了，就是版本的问题，在anaconda3虚拟环境的Lib\site-packages\mmdeploy\codebase\mmpose\deploy里面的pose_detection_model.py中144行那里老版本的需要把那几行代码换上新版本的就行了，但是不知道为啥pytorch转换成onnx推理预测的样本效果很差
- shop_keeper回复K.K.U 2024.01.11
  我重新跟着官方的教程把mmdeploy从1.3.0升级到1.3.1就好了，不知道是不是版本的原因[face]emoji:010.png[/face]
- K.K.U回复shop_keeper 2024.01.09
  你这个问题很模糊，博主定位不了是什么导致的啊

小新eQ 2023.12.21
在转tensorrt时遇到这个问题，求解 mmengine - ERROR - D:\Anaconda\envs\pythonH\lib\site-packages\mmdeploy\apis\core\pipeline_manager.py - pop_mp_output - 80 - `mmdeploy.apis.pytorch2onnx.torch2onnx` with Call id: 0 failed. exit.
- 2301_79994064回复小新eQ 2024.07.11
  你好，请问这个问题解决了吗

AWERTYUSGJK 2023.12.20
在推理的时候，报错 no module named mmdeploy-runtime,但是安装的时候pip install mmdeploy_runtime-gpu，换了好几个源都安装不上， ERROR: Could not find a version that satisfies the requirement，应该如何解决呢？
- K.K.U回复AWERTYUSGJK 2023.12.20
  pip install mmdeploy-runtime-gpu你是不是把横杠打成下划线了，没问题的话就不指定版本号试试

AWERTYUSGJK 2023.11.28
up,检测的时候出现[code=python] loading mmdeploy_ort_net.dll ... Traceback (most recent call last): File "D:/yolov8/mm1/mmdeploy/detect.py", line 8, in <module> detector = Detector(model_path='D:\yolov8\mm1\work_dir\\trt\\resnet', device_name='cuda', device_id=0) RuntimeError: failed to create detector [2023-11-28 22:30:41.950] [mmdeploy] [info] [model.cpp:35] [DirectoryModel] Load model: "D:\yolov8\mm1\work_dir\trt\resnet" [2023-11-28 22:30:41.950] [mmdeploy] [error] [common.cpp:67] Device "cuda" not found [/code]这种错误应该如何解决呢
- K.K.U回复AWERTYUSGJK 2023.11.29
  首先确保自己使用的是英伟达的显卡，然后查看显卡驱动版本是不是太老，然后查看CUDA和cudnn是否安装，版本能否对上pytorch版本。最好再看看tensorRT版本能否对上cuda版本

AWERTYUSGJK 2023.11.27
不知道是不是这的问题，在下一步转onnx的时候出现RuntimeError: Failed to parse onnx, In node 538 (importFallbackPluginImporter): UNSUPPORTED_NODE: Assertion failed: creator && "Plugin not found, are the plugin name, version, and namespace correct?"这个错误，不知道如何解决

AWERTYUSGJK 2023.11.27
使用tools/check_env.py检查环境配置的时候，tensorrt custom ops: NotAvailable，up主那是可用的，会有影响吗
- AWERTYUSGJK回复K.K.U 2023.11.27
  对的
- K.K.U回复AWERTYUSGJK 2023.11.27
  你的mmdeploy-runtime装的是gpu版本的吗
- AWERTYUSGJK回复K.K.U 2023.11.27
  up，应该如何修改一下呢
- K.K.U回复AWERTYUSGJK 2023.11.27
  影响是有的，如果你要部署的网络里面有tensorrt不支持的算子就不行，这个custom ops就是mmdeploy官方写的自定义算子