【torch加速】python onnx to tensorRT报错NotImplementedError: Converting dtype(‘float16‘) to a ctypes type

最新推荐文章于 2025-07-04 15:14:56 发布

原创最新推荐文章于 2025-07-04 15:14:56 发布 · 643 阅读

10 ·

CC 4.0 BY-SA版权

文章标签：

#python #深度学习 #人工智能 #算法 #pytorch

文章讲述了在将PyTorch模型转换为TensorRT并进行推理时遇到的NotImplementedError，涉及到float16到ctype类型的转换问题。作者通过将float16替换为int16作为临时解决方案，参考了TensorRTGitHub项目中的Yolov3示例。

部署运行你感兴趣的模型镜像

在进行torch加速时，使用了torch-onnx-torch的思路，当前阶段已成功生成tensorrt engine,但是在使用tensor RT engine进行推理的过程中遇到了该报错：NotImplementedError: Converting dtype(‘float16’) to a ctypes type

推理实现过程参考的tensorRT github项目的example中的yolov3-https://github.com/NVIDIA/TensorRT/tree/release/8.6/samples/python/yolov3_onnx

报错是出现在common文件的HostDeviceMem函数中，意思是float16类型在ctype中没有定义，解决方式见TensorRT issue #3222：

I made a workaround :

 1. Initialize np.ndarray from int16 ctypes point 
 2. use arr.dtype = np.float16 to change dtype inplace.

其意思就是既然ctype没有该类型，就在开辟内存时用int16类型来代替float16，因为他们占用的内存大小是一样的。

您可能感兴趣的与本文相关的镜像

PyTorch 2.5

PyTorch

Cuda

PyTorch 是一个开源的 Python 机器学习库，基于 Torch 库，底层由 C++ 实现，应用于人工智能领域，如计算机视觉和自然语言处理

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

↣life♚

关注关注

6
点赞
踩
10

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
打赏
打赏
打赏举报

举报

完美解决 NotImplementedError: Cannot convert a symbolic Tensor (sequential/gru/strided_slice:0) to a

qlkaicx的博客

06-14

1万+

这个错误通常是在将 tensorflow 张量转换为 NumPy 数组时发生的。通常，这可能是因为我们尝试使用不兼容的类型转换将张量转换为 NumPy 数组，或者尝试在需要 tensorflow 张量的情况下将其传递给接受 NumPy 数组的函数。意思就是tensorflow的版本过高或者numpy的版本过高，我们可以降低版本。

【onnx转tensorrt报错】IShuffleLayer applied to shape tensor must have 0 or 1 reshape dimensions: dimensi

m0_61139217的博客

08-20

2536

IShuffleLayer applied to shape tensor must have 0 or 1 reshape dimensions: dimensions were [-1,2])

参与评论您还未登录，请先登录后发表或查看评论

NotImplementedError

A_John 的博客

04-21

1万+

1、错误提示 ``python`` 程序运行报错： `` NotImplementedError `` 2、错误原因 python程序中，raise 可以实现报错的功能，且报错的条件和内容都是程序员自己规定的；在面向对象编程中，如果想在父类中预留一个方法，使该方法在子类中实现，如果子类中没有对该方法进行重写就被调用，则会报错：NotImplementError ！而这边是因为没有调用 ``forward()`` 方法 3、解决方案

模型量化！ONNX转TensorRT(FP32, FP16, INT8)

qq_43522163的博客

07-10

9186

模型量化！ONNX转TensorRT(FP32, FP16, INT8)

PyTorch 模型 bfloat16 训练深度排查：Conv3d 的 NotImplementedError 分析与解决

最新发布

m0_63460124的博客

07-04

952

本文详细记录了PyTorch模型在bfloat16精度训练时遇到的Conv3d算子NotImplementedError排查全过程。通过对比分析发现，问题根源在于模型被错误放置在CPU上而尝试以bfloat16精度执行，而PyTorch的Conv3d不支持CPU+bfloat16组合。解决方案是将模型和数据统一迁移到CUDA设备。文章总结了混合精度训练的设备限制问题，并提出了防御性编程、调试输出、构建最小可复现案例等实用建议，为开发者提供了系统性的问题定位思路和最佳实践。核心结论是确保模型和输入数据的设备(

pytorch学习时的NotImplementedError

m0_51600355的博客

08-01

2133

pytorch学习时的NotImplementedError 文章目录一、前言二、我的代码三、我的错误一、前言在B站学习pytorch，看的是小土堆up主的视频，历经不少艰难险阻当学到“神经网络-卷积层这节内容时，代码和视频中的完全像同，但是我的却出现了NotImplementedError的报错，百思不得其解，枯了，希望能有人帮我看看二、我的代码代码如下（示例）： import torch from torch import nn from torch.nn import Conv2d

PyTorch → ONNX → TensorRT：模型转换实战全流程与踩坑指南

努力分享一些人工智能、计算机视觉、影像等相关的知识干货！

04-11

2204

想用 TensorRT 部署 PyTorch 模型，第一步就是完成 ONNX 导出与转换流程。但很多开发者在导出 ONNX 时就踩了坑，在转 engine 时又报错一堆。本文将从实战出发，手把手带你完成 PyTorch → ONNX → TensorRT 的标准流程，讲透常见问题、调试方法、转换工具使用技巧，确保你能“0 中断”地完成部署第一步。

C++ onnxruntime 报错Ort::Exception: tried creating tensor with negative value in shape

qq_31930361的博客

04-12

2882

C++ onnxruntime 报错Ort::Exception: tried creating tensor with negative value in shape 1. 环境与配置 MacOS C++环境 onnxruntime1.10.0（brew安装） 2.报错情形使用pytorch导出的 .onnx模型文件，其动态轴设定如下： input = torch.randn(1, 3, 736, 736) dynamic_axes = {'images': {2: 'height',

Pytorch转ONNX采坑记：Converting a tensor to a Python boolean might cause the trace to be incorrect. We...

Einstellung的博客

05-02

1万+

如果你用Pytorch定义的网络结构太过于灵活，那么转成ONNX的时候很有可能出错。这个报错通常情况下是你的网络结构中出现if else 语句。比如 if cfg.CUDA: eps = torch.cuda.FloatTensor(std.size()).normal_() else: eps = torch.Flo...

Torch 转 ONNX遇到UnsupportedOperatorError: Exporting the operator ::resolve_conj to ONNX opset version

Y_飞鱼

07-05

2512

【代码】Torch 转 ONNX遇到UnsupportedOperatorError: Exporting the operator ::resolve_conj to ONNX opset version。

Pytorch NotImplementedError

weixin_41407236的博客

07-09

1545

使用Pytorch搭建神经网络的时候出现了一下问题提示我们出现了NotImplementedError 刚开始以为是 forward出问题了翻来覆去的检查了好几遍语法没有发现问题后来发现在原来是缩进问题 def forward的缩进与原来的函数出现了一个tab的距离缩进以后就可以正常的玩耍了 ...

Pytorch遇到的错误及解决方法

zx93的博客

09-15

3797

Pytorch遇到的错误及解决方法

PyTroch报错NotImplementedError:

热门推荐

远方

03-10

1万+

1.在写PyTorch网络模型时出现以下报错： NotImplementedError，该错误表示尚未成功的实现某种方法。以下为报错界面，经过查询错误位置。在‘forward’定义处！ 2.查找错误经过查看，'forward’定义处缩进错误！如下图，def forward 不应该和self在同一缩进层，所以报错！！，所有减少def forward 以及后面的代码缩进即可。修改： Ctrl ...

“NotImplementedError: Could not run ‘torchvision::nms‘ with arguments from the ‘CUDA‘ backend.”

qq_42548064的博客

05-30

4227

当前环境： CUDA-11.3 torch-1.11.0 torchvision-0.10.0+cpu 报错原因：在官网下的torchvision是cpu版本：torchvision-0.10.0+cpu，不能调用CUDA 尝试解决：在官网用conda重新安装但是安装torchvision仍然是cpu版本。折腾几番，发现是因为torch-1.11.0还没有对应torchvision的gpu版本。解决方案：换成CUDA 11.3 对应的更低版本的torch与torchvision pip3 ins

Vitis-AI在生成量化模型报错 NotImplementedError

jedibobo的博客

03-27

809

Vitis-AI在生成量化模型报错 Traceback (most recent call last): File "generate_model.py", line 191, in <module> run_main() File "generate_model.py", line 185, in run_main quantize(args.build_dir,args.quant_mode,args.batchsize) File "generate_model

tensorrt踩坑日记（python pytorch 转 onnx 推理加速）

qq_44756223的博客

08-01

4132

配置： Ubuntu 16.04 python 3.6 onnx 1.6 pytorch 1.5 pycuda 2019.1.2 torchvision 0.1.8 建议详读,先安装好环境官网指导手册步骤： 1.将pytorch模型转换成onnx模型这边用的是Darknet生成的pytoch模型 import torch from torch.autograd import Variable import onnx input_name = ['input'] output_n

yolov5-pytorch模型转onnx模型再转tensorflow savedmode模型进行tfserving部署

qq_36756866的博客

05-15

4322

pytorch框架下的yolov5模型部署到tensorflow serving，需要将pytorch的pt模型转换为onnx模型，再将onnx模型转换为tfserving的savedmode模型。 1. pytorch的pt模型转onnx模型使用yolov5中自带的 export.py 脚本（在models下）可以将模型导出为 TorchScript， ONNX, CoreML。环境： yolov5-5.0的requirements.txt dependencies, including Python

torch.onnx.export出现ValueError: too many values to unpack (expected 5)报错

01-08

### 解析 `torch.onnx.export` 函数中的 `ValueError` 当遇到 `torch.onnx.export` 报错 `ValueError: too many values to unpack (expected 5)` 时，这通常意味着函数调用过程中尝试解包的数量与实际返回值数量不匹配。具体来说，在此场景下可能是传递给 `export` 方法的参数数目或结构不符合预期。 #### 原因分析错误提示表明期望有五个值被解开分配给变量，但实际上接收到的数据包含了更多或更少的内容。对于 `torch.onnx.export()` 来说，常见的原因包括但不限于： - 输入张量列表长度不对。 - 动态形状处理不当。 - 版本兼容性问题导致的行为差异[^1]。 #### 解决方案针对上述情况，建议采取以下措施来解决问题： 1. **验证输入参数** 确保传入 `torch.onnx.export` 的模型、输入张量和其他必要参数完全按照官方文档的要求设置。特别是要仔细核对用于模拟推理过程的实际输入数据形式是否正确无误。 2. **调整输出格式** 如果确实存在额外的输出项，则应该相应修改接收这些输出的方式。例如，如果是从环境中获取状态信息时遇到了多余的返回值，那么可以在定义接收变量的地方增加占位符 `_` 来忽略不需要的部分，就像之前提到的例子那样做更改 `s_, r, done, info = env.step(a)` 改成 `s_, r, done, info, _ = env.step(a)`。 3. **更新库版本** 考虑到不同版本之间可能存在行为上的变化，有时降低某些依赖库（如 PyTorch 或 ONNX）至特定稳定版也可能有助于消除此类异常。不过在此之前应当先查阅相关项目的发行日志了解是否存在已知的相关 bug 和对应的解决方案[^2]。 4. **调试模式下的测试** 启用详细的日志记录功能可以帮助定位确切的问题所在。通过打印出每次调用前后各个阶段的状态以及最终产生的结果集大小，能够更容易发现哪里出现了偏差。 ```python import torch from torch import onnx # 设置环境以便于捕获更多信息 onnx.set_default_opset_version(11) dummy_input = ... # 定义合适的虚拟输入 model = MyModel() # 初始化待导出的模型实例 try: with torch.no_grad(): output = model(dummy_input) print(f"Output shape before export: {output.shape}") # 尝试导出ONNX文件前先单独执行一次forward pass查看是否有其他潜在问题 torch.onnx.export( model, dummy_input, "mymodel.onnx", input_names=["input"], output_names=["output"], dynamic_axes={"input":{0:"batch_size"}, "output":{0:"batch_size"}}, opset_version=11, verbose=True ) except Exception as e: print(e) finally: print("Debug information printed above.") ```