Pytorch显存充足出现CUDA error:out of memory错误

最新推荐文章于 2025-05-28 08:14:07 发布

原创最新推荐文章于 2025-05-28 08:14:07 发布 · 1w 阅读

·

1

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#cuda #gpu #pytorch

DL 专栏收录该内容

5 篇文章

订阅专栏

当Pytorch在CUDA环境下运行时，即使显存充足，也可能遇到'out of memory'错误。这可能是Tensorflow与Pytorch冲突导致的。解决方案是设置CUDA_VISIBLE_DEVICES环境变量，限制使用特定GPU，例如CUDA_VISIBLE_DEVICES=2,3，使得进程只使用物理上的2、3号GPU，避免资源冲突。" 132648321,19673927,Python实现计算IOU算法,"['计算机视觉', '图像处理', 'Python编程', '算法']

Pytorch显存充足出现CUDA error:out of memory错误

Ref:
https://www.cnblogs.com/jisongxie/p/10276742.html

报错内容

Bug描述

显存充足，并且已经通过 torch.nn.DataParallel 指定GPU编号
CUDA与CUDNN均无错误，NVIDIA驱动无错误

解决方案

以上情况很可能是是Tensorflow和pytorch冲突导致的，因为我发现当我同学在0号GPU上运行程序我就会出问题。
详见pytorch官方论坛：
https://discuss.pytorch.org/t/gpu-is-not-utilized-while-occur-runtimeerror-cuda-runtime-error-out-of-memory-at/34780

使用 CUDA_VISIBLE_DEVICES 限制一下使用的GPU。
比如有0,1,2,3号GPU，CUDA_VISIBLE_DEVICES=2,3，则当前进程的可见GPU只有物理上的2、3号GPU，此时它们的编号也对应变成了0、1，即cuda:0对应2号GPU，cuda:1对应3号GPU。

# 使用python的os模块

import os
os.environ['CUDA_VISIBLE_DEVICES']='2, 3'

# 直接设置环境变量(linux系统)

export CUDA_VISIBLE_DEVICES=2,3

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。