PyTorch2ONNX2TensorRT 踩坑日志

最新推荐文章于 2025-09-19 08:19:35 发布

原创最新推荐文章于 2025-09-19 08:19:35 发布 · 2.1w 阅读

75 ·

CC 4.0 BY-SA版权

文章标签：

#onnx #pytorch #tensorrt #转换 #onnx2tensorrt

学习笔记同时被 3 个专栏收录

44 篇文章

订阅专栏

linux gpu 相关

9 篇文章

订阅专栏

TRT

3 篇文章

订阅专栏

本文记录了从PyTorch模型转换至ONNX，再使用TensorRT进行序列化的全流程踩坑经验，包括解决RuntimeError、UnsupportedNode等问题，以及替代方法和思路分享。

部署运行你感兴趣的模型镜像

PyTorch2ONNX2TensorRT 踩坑日志

从“用PyTorch写的网络，通过ONNX，使用TensorRT序列化，最终完成模型加速”的全流程踩坑日志。

2019/12/07 初版
2019/12/17 更新AdaptivePooling, 找BUG思路
2019/12/27 添加AdaptivePooling示例
2020/01/01 添加VGG16示例链接

实验环境

ONNX可以不用安装，对ONNX2TRT没有影响，推荐使用anaconda管理包。

Ubuntu 16.04
RTX2080TI, Driver Version: 410.79
CUDA 10.0
cudnn 7.6.3 (经测低版本如7.5.0无影响)
pycuda 2019.1.2
pytorch 1.3.1
torchvision 0.4.2
tensorrt 6.0.1.5
python 3.6.9
- 经测ONNX无法使用，建议使用python 3.7.x
- onnx 1.6.0
- protobuf 3.9.2 (需要降级到3.9.x，不然onnx会报libprotobuf.so.20的错)

1. RuntimeError: ONNX export failed: Couldn’t export operator aten::upsample_bilinear2d

无法解决，ONNX2TensorRT报错，待TensorRT后续版本支持，见后文替代方法#4

近似地，应该与警告信息 UserWarning: ONNX export failed on upsample_bilinear2d because align_corners == True not supported 相关联。

原因

转换ONNX使用的版本较低，PyTorch.ONNX不支持。另外，参考源码， torch.onnx.export 默认使用 opset_version=9。

解决办法

警告信息已经完整说明，ONNX's Upsample/Resize operator did not match Pytorch's Interpolation until opset 11.，因此将ONNX的导出代码中规定其版本，具体如下：

import torch
torch.onnx.export(model, ..., opset_version=11)

较完整报错信息

输出的个人信息就被我隐去了，也为了报错、警告的简洁，所以这里叫做“较完整”，此说明后续不再赘述。

UserWarning: You are trying to export the model with onnx:Upsample for ONNX opset version 9. This operator might cause results to not match the expected results by PyTorch.
ONNX's Upsample/Resize operator did not match Pytorch's Interpolation until opset 11. Attributes to determine how to transform the input were added in onnx:Resize in opset 11 to support Pytorch's behavior (like coordinate_transformation_mode and nearest_mode).
We recommend using opset 11 and above for models using this operator. 

UserWarning: ONNX export failed on upsample_bilinear2d because align_corners == True not supported

RuntimeError: ONNX export failed: Couldn't export operator aten::upsample_bilinear2d

2. RuntimeError: ONNX export failed: Couldn’t export operator aten::adaptive_avg_pool2d

无法解决，ONNX2TensorRT报错，待TensorRT后续版本支持，见后文替代方法#5

类似错误 aten::adaptive_avg_pool*d：onnx#63, pytorch#14395, discuss.pytorch#30204

原因

因为PyTorch的网络中用了 torch.nn.AdaptiveAvgPool2d ，个人感觉，ONNX没有 avg_pool2d 操作，见ONNX Operator，所以PyTorch.ONNX就会报错 aten::adaptive_avg_pool2d 无法转换。

解决办法

参考pytorch#14395添加额外Option，如下：

import torch
torch.onnx.export(model, ..., operator_export_type=torch.onnx.OperatorExportTypes.ONNX_ATEN_FALLBACK)

该方法只是阻止ONNX替换PyTorch的OP、而是使用ATen的OP替换，PyTorch2ONNX能通，但ONNX2TRT却不能通，原因是ONNX phaser识别不到非ONNX的OP。

较完整报错信息

UserWarning: ONNX export failed on adaptive_avg_pool2d because output size that are not factor of input size not supported

RuntimeError: ONNX export failed: Couldn't export operator aten::adaptive_avg_pool2d

3. Error: In node 2 (importGather): UNSUPPORTED_NODE: Assertion failed: !(data->getType() == nvinfer1::DataType::kINT32 && nbDims == 1) && “Cannot perform gather on a shape tensor!”

原因

"Cannot perform gather on a shape tensor!"，网络内部使用x_size = x.size()[1:]等类似操作，TensorRT在trace的时候，会被解析成一个shape layer的输出，获得一个shape tensor，用Netron工具可视化就可以发现，对应的node 2实际上是个Constant node，与预期不符。

解决办法

不使用该操作，另一种解法来自onnx-tensorrt#192

x_size = torch.tensor(x.shape)[1:]

4. Error: In node 1 (importUpsample): UNSUPPORTED_NODE: Assertion failed: (nbDims >= 1) && (nbDims <= 3)

使用Netron工具可视化模型，找到对应的node 1，就可以发现对应的是F.interpolate(x, size=(128, 128), mode='bilinear', align_corners=False)操作。

原因

目前ONNX2TRT的转换过程中，貌似不支持F.interpolate的bilinear模式，只支持linear和nearest。

解决办法

将所有的bilinear模式替换为nearest模式。

5. 使用AvgPooling替换AdaptivePooling

针对2. RuntimeError: ONNX export failed: Couldn't export operator aten::adaptive_avg_pool2d问题，使用AvgPooling替换AdaptivePooling。因为ONNX支持AvgPooling，PyTorch2ONNX、ONNX2TRT流程能够跑通。

原因

目前PyTorch2ONNX流程中，ONNX并不支持AdaptivePooling操作，该操作仅存于PyTorch中。

解决方法

参考[开发技巧]·AdaptivePooling与Max/AvgPooling相互转换一文、PyTorch官方文档可知，AdaptivePooling可通过输入大小input_size自适应控制输出大小output_size，而一般的AvgPooling/MaxPooling则是通过kernel_size、stride、padding来计算output_size，公式如下：

$\mathbf{output\_size} = ceil(( \mathbf{input\_size} + 2 * \mathbf{padding} - \mathbf{kernel\_size}) / \mathbf{stride})+1$

因此通过input_size、output_size反推kernel_size、stride、padding，参考官方源码将padding设为0，那么可推出去kernel_size、stride：

$\mathbf{stride} = floor(\mathbf{input\_size} / \mathbf{output\_size})$
$\mathbf{kernel\_size} = \mathbf{input\_size}- (\mathbf{output\_size}-1) * \mathbf{stride}$

示例

例如，PyTorch网络的某一层含有nn.AdaptiveAvgPool2d(output_size=(14,14))，它的output_size为(14, 14)，该层的输入特征图大小为10*128*128，那么输出的特征图大小为10*14*14，那么带入公式，可计算出nn.AvgPool2d(kernel_size, stride)的stride=(int(128/14), int(128/14)), kernel_size=((128-(14-1)*stride, (128-(14-1)*stride)，验证如下：

import torch
from   torch import nn

input = torch.randn(10, 36, 36)
AAVP = nn.AdaptiveAvgPool2d(output_size=(12,12))
AVP  = nn.AvgPool2d(kernel_size=(3,3), stride=(3,3))

output_AAVP = AAVP(input)
output_AVP  = AVP(input)

6. PyTorch2ONNX、ONNX2TRT到底哪里出了问题？

下面是遇到无法解决的问题后该找谁问的一个思路：

PyTorch2ONNX是调用的PyTorch内部的转换脚本，所以PyTorch2ONNX出了问题，需要去PyTorch那里的issue寻找解决办法；ONNX2TRT是使用ONNX自己写的转换脚本onnx-tensorrt，同理如果ONNX2TRT出了问题，就需要到它的那里找解决办法；在产生好TRT模型后，使用TRT模型进行推理出问题了，那就要去TRT那里问了，有GitHub和官方论坛可以使用。

那怎么让报错暴露出来呢，下面是一些办法。

解决方法

按下列方法多半能找到问题所在。

1. PyTorch2ONNX

更新PyTorch到最新版，一般最新版中ONNX的OP支持应该会更多；
按下列代码将日志等级调到最高，逐一分析。

import torch
torch.onnx.export(..., verbose=True, ...)

2. 检测ONNX模型

下载Netron可视化自己的ONNX模型，分析是否与PyTorch模型一致，或者与自己想造的模型一致。多看看resize、shape、permute操作，ONNX对这些需要对tensor切片的操作不是很支持。

3. ONNX2TRT

更新onnx-tensorrt库，也就是libnvonnxparser.so。下面贴一段TRT的安装步骤：
1. 安装TRT.
2. 编译onnx-tensorrt.
3. 将libnvonnxparser.so移到TRT的lib文件夹中.
按下列代码将日志等级调到最高，逐一分析。

import tensorrt as trt
TRT_LOGGER = trt.Logger(trt.Logger.VERBOSE)

最终解决办法

放弃ONNX2TRT吧，PyTorch与ONNX与TRT的版本难以互相支持，在版本的迭代中任意节点不支持了，整个链路就会断掉，另外TRT是闭源的项目，你完全不知道ONNX2TRT的过程中出了哪些问题，就算有堆栈信息，也不可能根据信息去trace它的错误。所以，直接使用TRT提供的api直接构建网络，是最复杂、也是最简单直接的方法。

Pytorch 2 TRT python API

使用TRT提供的python接口，构建网络，整个流程十分简单，大家可以看看TRT提供的示例<TRT_root>/samples/python/network_api_pytorch_mnist/sample.py，与之对照的是<TRT_root>/samples/python/network_api_pytorch_mnist/model.py：

def populate_network(network, weights):
    # Configure the network layers based on the weights provided.
    input_tensor = network.add_input(name=ModelData.INPUT_NAME, dtype=ModelData.DTYPE, shape=ModelData.INPUT_SHAPE)
    """
    TRT python API
    """
    network.mark_output(tensor=fc2.get_output(0))

你只需要把这个populate_network写出来就好了，weights就是网络的权重了，由torch.load()得到，是不是超级简单啊。想使用PyTorch的F.interpolate的bilinear模式？TRT提供！下篇日志将会记录“如何使用TRT python API搭建简单的VGG16网络”，我再也不想用ONNX2TRT了。

您可能感兴趣的与本文相关的镜像

PyTorch 2.8

PyTorch

Cuda

PyTorch 是一个开源的 Python 机器学习库，基于 Torch 库，底层由 C++ 实现，应用于人工智能领域，如计算机视觉和自然语言处理

26 条评论

卷卷写代码 2023.03.31
谢谢博主，问题解决了。

无风的浪花 2022.11.03
输入的input_size怎么获取呀，我通过nn,Sequential构建的

故桥 2022.08.16
感谢分享，写的很棒！我最近也在研究用AvgPool代替AdaptiveAvgPool，得到的结论是，如果输出尺寸能够被输入尺寸整除，是可以代替的；如果不能够整除，则不可以代替，因为在这种情况下AdaptiveAvgPool中的kernel_size尺寸是可变的。具体可参考：https://stackoverflow.com/questions/53841509/how-does-adaptive-pooling-in-pytorch-work/63603993#63603993
- 无风的浪花回复故桥 2022.11.03
  输入的input_size怎么获取呀，我通过nn,Sequential构建的

aerfa109 2022.05.19
RuntimeError: Unsupported: ONNX export of operator adaptive pooling, since output_size is not constant.. Please open a bug to request ONNX export support for the missing operator. 这个有人能看懂啥问题吗
- 牧猫玖回复aerfa109 2022.08.04
  解决了吗

u010395893 2022.02.21
ERROR: builtin_op_importers.cpp:2249 In function importPad: [8] Assertion failed: inputs.at(1).is_weights() onnx转trt时出错，是这份代码的2249行。if (needToExpandDims) { // Un-expand spatial dims back to 1D const std::vector<int32_t> axes{3}; tensorPtr = squeezeTensor(ctx, node, *tensorPtr, axes); ASSERT(tensorPtr && "Failed to unsqueeze tensor.", ErrorCode::kUNSUPPORTED_NODE); } return {{tensorPtr}}; } 不知道到底哪里出问题

wq_0708 2021.10.22
讲一下python下如何添加自定义插件吧？我用c++编完插件的so文件，到python这边用TRT Python API 搭建网络，输出有问题

CVer儿 2021.03.16
” Exporting the operator max_unpool2d to ONNX opset version 12 is not supported.“ 请问你这个错误是不是因为onnx不支持这个op呢
- 麦克斯韦恶魔回复CVer儿 2021.03.19
  是的，https://github.com/onnx/onnx/blob/master/docs/Operators.md 在这里可以查询op支持情况，https://github.com/onnx/onnx/blob/master/docs/Operators.md#MaxUnpool看起来opset=11或9可以满足

刻师傅 2021.01.06
楼主有没有 'upsample_bilinear2d'层，这层怎么处理的呢，好像是不支持'bilinear'，换nearest会降低精度，用'bilinear'能转onnx，但是转trt中network.num_layers为0。
- 麦克斯韦恶魔回复刻师傅 2021.01.12
  能按照这个层的算法流程自己写一个吗，如果没有的话就只能自己重写了

刻师傅 2021.01.04
.trt模型怎么用呢？
- 麦克斯韦恶魔回复刻师傅 2021.01.05
  如果是python，可以参考我从trt扒拉下来的代码 https://github.com/jjkislele/i_just_want_a_simple_demo/tree/master/trt_api_pytorch/python_samples 如果是cpp，就直接可以看官方在线文档 https://github.com/NVIDIA/TensorRT/tree/master/samples/opensource

qq_41618518 2020.10.13
onnx支持avg_pool ,但是里面的pad为啥会跑到模型外面来呢
- 麦克斯韦恶魔回复qq_41618518 2020.10.28
  哈哈，的确是的。相互学习，共同进步。
- qq_41618518回复麦克斯韦恶魔 2020.10.27
  我版本的问题，porch版本太低，里面坑挺多的
- 麦克斯韦恶魔回复qq_41618518 2020.10.26
  诶，我整的模型里有AdaptivePooling，但是onnx不支持它，所以就用AvgPooling进行替换，至于后半段话，我没看太明白，是说AdaptivePooling转AvgPooling的padding吗，因为转换导致padding的位置变化？