关于pytorch模型转tensorrt模型遇到的问题

最新推荐文章于 2024-11-05 15:04:55 发布

橘色闪光

最新推荐文章于 2024-11-05 15:04:55 发布

阅读量1.6k

点赞数

CC 4.0 BY-SA版权

分类专栏：图像分割技术文章标签： pytorch 深度学习神经网络

本文链接：https://blog.youkuaiyun.com/weixin_41630455/article/details/120550334

图像分割技术专栏收录该内容

6 篇文章

订阅专栏

在将使用UNet模型的DCM组织钙化检测系统从PyTorch模型转为ONNX并进一步部署到嵌入式设备的TRT中时，遇到精度下降的问题。经过排查，发现在不同环境中转换的ONNX模型存在精度差异。初步怀疑是由于PyTorch版本差异（1.4.0 vs 1.9.0）导致的精度损失，因为1.9.0可能在转换时保留了更多精度。下一步计划验证这个假设。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

实现一个对于dcm格式的人体切下来的组织就行钙化点检测。我采用了unet分割算法，期间pth模型训练已经到达了一定精度。准备部署到嵌入设备上。期间遇到一个印象深刻的坑，pth转onnx转trt。用trt跑的时候精度变低了。试了trtexec的命令进行各种参数设置并没有改观该现象。在onnx转trt过程中查了很多资料也辗转了很久以为是onnx转换过程出现了问题。后来无意一次心血来潮想试一下onnx的本身精度。发现onnx的精度也有问题，那么问题原来处在onnx上。问题解决的也挺奇特的，本来onnx是放在baiduaistudio环境下转的onnx版本也是1.10.1的，转换下来有误差。后来在自己电脑上转了竟然发现之前明显的误差没有了这就很奇怪，我的onnx版本也是一样的哈。这就很奇怪。那么问题处在哪里呢，个人感觉问题处在torch版本上，baiduaistudio的torch版本是1.4.0而我的电脑版本是1.9.0的,但是我训练环境又是1.4.0的版本这就有点诡异了。

可能原因是1.4.0还没有混合精度概念，而1.9.0转onnx的时候载入模型参数后进入eval模式应该转onnx时候能够保存了更多的精度。这是我的猜想，后面还要验证下