Pytorch显存充足出现CUDA error:out of memory错误

当Pytorch在CUDA环境下运行时,即使显存充足,也可能遇到'out of memory'错误。这可能是Tensorflow与Pytorch冲突导致的。解决方案是设置CUDA_VISIBLE_DEVICES环境变量,限制使用特定GPU,例如CUDA_VISIBLE_DEVICES=2,3,使得进程只使用物理上的2、3号GPU,避免资源冲突。" 132648321,19673927,Python实现计算IOU算法,"['计算机视觉', '图像处理', 'Python编程', '算法']

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Pytorch显存充足出现CUDA error:out of memory错误

Ref:
https://www.cnblogs.com/jisongxie/p/10276742.html

报错内容

img

Bug描述

显存充足,并且已经通过 torch.nn.DataParallel 指定GPU编号
CUDA与CUDNN均无错误,NVIDIA驱动无错误

解决方案

以上情况很可能是是Tensorflow和pytorch冲突导致的,因为我发现当我同学在0号GPU上运行程序我就会出问题。
详见pytorch官方论坛:
https://discuss.pytorch.org/t/gpu-is-not-utilized-while-occur-runtimeerror-cuda-runtime-error-out-of-memory-at/34780

CUDA Error: out of memory是指在GPU运行过程中内存不足导致的错误。 出现这个错误的原因是,模型所需的显存超过了GPU的可用内存。这可能是因为模型太大或者输入数据的批次太大。为了解决这个问题,有几个方法可以尝试: 1. 将批次大小(batch size)减小:减小每个批次中的样本数量可以减少模型所需的显存。可以尝试减小批次大小直到不再出现内存不足的问题。 2. 使用item()属性提取torch变量的标量值:在计算过程中,确保只保留必要的变量,而不是保留整个计算图。当你需要提取torch变量的标量值时,使用item()属性而不是保留整个变量。这样可以释放一些显存。 3. 在测试阶段添加代码释放显存:在测试阶段,可以手动释放一些不再使用的显存。可以通过调用torch.cuda.empty_cache()来清空显存。这样可以为后续的计算释放一些显存空间。 请记住,这些方法不一定适用于所有情况。如果问题仍然存在,可能需要考虑使用更大的GPU或减小模型的规模。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *2* [CUDA error: out of memory](https://blog.csdn.net/ayuuuuu/article/details/129376615)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 50%"] - *3* [pytorch模型提示超出内存RuntimeError: CUDA out of memory.](https://download.csdn.net/download/weixin_38552305/14884908)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值