keras 训练模型提示“CUDA_ERROR_OUT_OF_MEMORY”

本文介绍了一种在使用GPU进行模型训练时,遇到显存不足问题的解决方案。通过使用fuser命令查找并杀死占用GPU资源的进程,可以有效解决CUDA_ERROR_OUT_OF_MEMORY错误。文章还提到了可能需要升级GPU以应对更大的模型。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一般在使用shh连接服务器的时候,用GPU训练模型,由于操作习惯问题。终直接在终端用ctrl+z终止训练,此时GPU资源可能未立即释放,
下次继续使用时有可能会报例如CUDA_ERROR_OUT_OF_MEMORY这种错误,就是提示显存不够。这时候需要人工来杀死占用GPU显存的进程。

这几天碰巧加载有一个较大的模型时,提示显存不足,特此解决:

这里就需要通过fuser 找到nivdia对应的程序进程,然后杀掉(fuser 显示使用指定文件或者文件系统的进程的PID。)。
第一步安装如下软件:

  1. 在centos系统下,输入以下指令安装

     yum install psmisc
    
  2. 然后,查看占用GPU资源的进程及ID

    fuser -v /dev/nvidia*
    
  3. 找到仍然在占用GPU的进程PID

     kill -9 pid  # 表示强迫进程立即停止
     kill pid # 也可以终止进程
    
  4. 大功告成。

其实也有可能是你需要花钱买一个更棒的显存,或者批量训练

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值