关于 ONNX 及其用 TensorRT 7.0加载

ONNX模型详解与应用

最新推荐文章于 2025-10-31 10:03:48 发布

原创最新推荐文章于 2025-10-31 10:03:48 发布 · 5.5k 阅读

4 ·

CC 4.0 BY-SA版权

人工智能专栏收录该内容

6 篇文章

订阅专栏

本文深入探讨ONNX模型的定义、转换与优化方法，包括ONNXRuntime、ONNX.JS及TensorRT的使用，同时介绍了ONNXModelZoo资源与模型部署技巧，最后讨论了模型转换与部署中可能遇到的问题。

部署运行你感兴趣的模型镜像

1）Onnx简介

ONNX 定义了一种可扩展的计算图模型、一系列内置的运算单元（OP）和标准数据类型。每一个计算流图都定义为由节点组成的列表，并构建有向无环图。其中每一个节点都有一个或多个输入与输出，每一个节点称之为一个 OP。这相当于一种通用的计算图，不同深度学习框架构建的计算图都能转化为它。

现阶段 ONNX 只支持推理，所以导入的模型都需要在原框架完成训练。

部分框架已经内嵌了 ONNX，开发者可以直接通过内置 API 将模型导出为 ONNX 格式，或采用它们作为推理后端。

部分框架并不直接支持 ONNX 格式，但是可以通过转换工具导入或导出。

2）用Onnx模型进行推理

微软开源了 ONNX Runtime，专为 ONNX 格式的模型设计了高性能推理引擎。可以自动调用各种硬件加速器，例如英伟达的 CUDA、TensorRT 和英特尔的 MKL-DNN、nGraph。

微软开源了 ONNX.JS，它是一种在浏览器和 Node.js 上运行 ONNX 模型的 JavaScript 库。它部署的模型效率非常高，且能实现交互式的直观推理。该开源项目给出了图像分类的交互式演示，且在 Chrome 浏览器和 CPU 下比 TensorFlow.JS 快了近 8 倍，采用了 WebAssembly 和 WebGL 技术，并在 CPU 或 GPU 上推理 ONNX 格式的预训练模型。

Facebook 开源了 ONNXIFI，为 ONNX 提供了用于加载和执行 ONNX 计算图的跨平台 API。

英特尔开源 nGraph，它能编译 ONNX 格式的模型，并在 CPU 或 GPU 等硬件加速模型的运行。

3） Onnx预训练模型

ONNX Model Zoo ,项目地址：https://github.com/onnx/models

包括常见神经网络的预训练模型，还为每个预训练模型开放了对应的训练代码。训练和推理代码都是用 Jupyter Notebook 写的，数据和模型等都有对应的链接。

4）Onnx模型优化与部署

可以通过TensorRT对模型进行优化和部署(转化为trt)，目前最高版本为TensorRT7.0

5) 其它格式转Onnx

参看：https://blog.youkuaiyun.com/u013597931/article/details/88063872

MXNET可直接利用mxnet export_model输出onnx模型，但有时会遇到以下错误：

onnx.onnx_cpp2py_export.checker.ValidationError: Unrecognized attribute: spatial for operator BatchNormalization

网上说这个是因为onnx版本太高了，可以降低至1.3.0。我降到1.3.0后转后能够通过，但加载onnx出现以下错误：

ERROR: ModelImporter.cpp:92 In function parseGraph:
[8] Assertion failed: convertOnnxWeights(initializer, &weights, ctx)

另一方法参考 https://github.com/apache/incubator-mxnet/issues/14589

即按以下方法修改mxnet中的/_op_translations.py程序：

@mxnet-label-bot
My onnx 1.5.0 (latest)
For batchnorm, I revised script mxnet/contrib/mx2onnx/_op_translations.py as follows:
1, on line 647: kernel = eval(attrs["kernel"]) if attrs.get("kernel") else None
This is needed for global pooling like:
x = mx.symbol.Pooling(data=data,
pool_type='avg',
global_pool=True,
name=name+'pool')

2, delete line 359: spatial=0
This line is not supported for onnx > 1.3.0

但是，按以上方法修改后，加载onnx时出现以下错误：

ERROR: builtin_op_importers.cpp:461 In function importConv:
[8] Assertion failed: nbSpatialDims == kernel_weights.shape.nbDims - 2

6）文件内容显示

可以用Netron打开Onnx文件，并以有向图的方式显示出来。该软件还能打开其它多种神经网络模型。

7）用TensorRT 7.0加载模型遇到的问题

（1）yolov3.onnx（从keras模型转换得到）：

ERROR: onnx2trt_utils.cpp:417 In function elementwiseHelper:
[8] Assertion failed: tensor_ptr->getDimensions().nbDims == maxNbDims && "Failed to broadcast tensors elementwise!"

（2）tiny_yolov2.onnx (从ONNX Model Zoo下载)：