yolov5:pytorch报错“RuntimeError: CUDA error: no kernel image is available for execution on the device“

在将一个使用PyTorch 1.7和CUDA 10.2的YOLOv5s目标检测训练模型从2080Ti服务器的Docker容器移植到Tesla V100服务器后,遇到了运行错误。错误可能与apex包有关,因为V100服务器上的apex是在2080Ti服务器上编译的。重新在V100服务器的Docker内编译apex后,模型成功运行。问题根源未明确,但更换apex编译环境解决了问题。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

在docker内运行用pytorch实现的yolov5s的目标检测训练模型,出现如下报错:

在这里插入图片描述
1,问题描述:

我的软硬件环境是ubuntu18 + Tesla v100 + cuda10.2 + pytorch1.7 + python3.6.9。

在网上查了好多资料,说是pytorch与cuda版本不匹配,但我肯定不是这个问题,因为这个yolov5s的目标检测训练模型我在另一台显卡为2080Ti的服务器上跑通了,而且在2080Ti的服务器的docker容器内也跑通了。现在的情况是我把这个装有yolov5s目标检测训练模型的docker容器移植部署到另一台显卡为Tesla v100的服务器上(其它环境都一样),然后在新的服务器内的docker里跑这个模型就报上图这些错误了。

2,解决方法

想了半天,没啥头绪,后来突然想到这个模型 中使用了apex包,显卡为v100的服务器docker里面的apex是在原来显卡为2080Ti的服务器上编译的,所以我在显卡为v100的服务器docker里面重新安装编译了apex,然后模型就可以跑通了。

至于具体的更深层次的报错原因我也不清楚,希望有大神解答!

Done!!!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

CrystalheartLi

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值