【报错解决】RuntimeError: CUDA error: out of memory

文章讲述了在运行ConvNext时遇到的报错问题,尝试了调整batch_size、清空GPU缓存、检测并杀死僵尸进程等方法,最终成功解决了GPU占用过高导致的错误。

在运行convnext时产生报错,将batch_size降低到1后仍然报错

1 查看nvidia-smi GPU进程

nvidia-smi

红框中为GPU占用情况 (之前达到14000+时报错)

查询后使用方法:

import torch
torch.cuda.empty_cache()

运行多次释放空间,查看GPU进程发现没有改变,仍然无效.

更改策略:

1 .运行以下代码:

fuser -v /dev/nvidia*

发现僵尸进程(连号的):

2.查看具体GPU使用情况

pmap -d 62282

3.删除该进程

kill-9 62282

4.全部删除后检查:

干干净净!撒花✿✿ヽ(°▽°)ノ✿

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值