RuntimeError: cuda runtime error (999)

项目场景:

模型训练开始–结束过程


问题描述:

一个数据集刚跑完,换另一个数据集继续做实验,训练一开始就爆出个Error,了不得!反正就是999未知错误。

RuntimeError: cuda runtime error (999) : unknown error at C:/cb/pytorch_1000000000000/work/aten/src\THCUNN/generic/ClassNLLCriterion.cu:235
RuntimeError: cuda runtime error (999) : unknown error at C:/cb/pytorch_1595629403081/work/aten/src/THC/THCGeneral.cpp:47

原因分析:

看到cuda runtime error,很好知道cuda出毛病了,然后看到999这是神马?感冒灵?就换了一下数据集的路径,总不可能动到其他文件吧,所以代码错误排除。

大概可能或许就是cuda初始化或者加载出问题了吧。


解决方案:

       1.针对linux系统(网上通用解决办法):

重新加载nvidia内核模块

sudo rmmod nvidia_uvm
sudo modprobe nvidia_uvm

       2.针对所有系统

没什么问题是重装不能解决的,如果有那就重装CUDA两遍!!!

       3.针对Windows系统

用惯了windows就是不想换系统,重装CUDA又那么费劲,懒人有懒人的万能解决办法:重启电脑,just so so!

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值