Pytorch使用训练好的模型时报错RuntimeError: cuda runtime error (10) : invalid device ordinal

本文解决了一种常见的PyTorch多GPU模型预测加载错误问题,该问题出现在从多GPU训练的模型切换到单GPU预测时。通过调整代码中CUDA_VISIBLE_DEVICES环境变量和DataParallel的device_ids参数,成功解决了CUDA error invalid device ordinal的运行时错误。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

跑了两天的模型,拿出来做预测的时候加载出了问题,报错如下:

RuntimeError: CUDA error (10): invalid device ordinal (check_status at /opt/conda/conda-bld/pytorch_1532579805626/work/aten/src/ATen/cuda/detail/CUDAHooks.cpp:36)

最后发现是因为自己训练的时候用了多卡:

        就是训练代码里的这两行代码惹的祸

os.environ['CUDA_VISIBLE_DEVICES'] = "0, 1, 2, 3"

net_model = nn.DataParallel(net_model, device_ids=[0, 1, 2, 3])

 

针对这种情况,解决方法如下:

        将预测代码里的这两行改为如下:

os.environ['CUDA_VISIBLE_DEVICES'] = "0, 1, 2, 3"

net_model = nn.DataParallel(net_model, device_ids=[0])

 

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值