解决由于cuda内存泄漏导致的中途cuda内存报错问题 torch.cuda.0utofMemoryError: CuDA out of memory.

じ☆ve 緈辐

于 2024-03-02 23:06:37 发布

阅读量1.4k

点赞数 8

文章标签：深度学习 python 人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/qq_44770238/article/details/136424070

版权

本文探讨了在深度学习中遇到的CUDA内存不足问题，主要原因是过大的batchsize和内存泄漏。提供了减少batchsize、使用torch.cuda.empty_cache()清理内存及避免频繁调用以保持性能的建议。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

模型报错截图

在运行代码中，代码能够运行。此时说明cuda的内存是足够支撑项目运行，但是运行中途cuda内存报错。对此在网上进行寻求答案。

cuda内存不够原因：

1：batchsize设置太大：

解决方法：减少batchsize的大小，尽可能的减少一批数据的加载

2：内存泄漏：

代码在每次迭代中都留下了未清理的数据，这些数据将累积并最终耗尽所有可用的 GPU 内存。这可能是因为某些变量没有被及时释放，或者某些操作导致了额外的内存占用。

解决方法：使用 torch.cuda.empty_cache() 清理未引用的 CUDA 内存，以及确保及时删除不再需要的变量。

`torch.cuda.empty_cache()` 代码使用注意事项

1：这个操作只会释放 PyTorch 未使用的缓存内存，不会释放已经分配给张量的内存。

2：通常在模型评估或模型训练的特定时刻（如每个 epoch 后）调用此函数，而不是在每个训练步骤中调用。（建议在epoch循环中使用，每结束一个epoch就释放缓存）

原因：频繁调用 torch.cuda.empty_cache() 可能会导致性能下降，因为释放内存并不是没有成本的操作。

声明：

此次文章只为记录研究学习期间遇到的问题以及解决方法用。目的仅供记录学习。

此次信息来源网络，本人不承担任何法律后果。

内容错误部分，还请谅解。目前我的问题已解决，但是你要和我犟，那就是你对，对对对！

じ☆ve 緈辐

博客等级

码龄6年

11
原创

68
点赞

98
收藏

80
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

上一篇：: _winapi.TerminateProcess(int(self._handle), TERMINATE)PermissionError: [WinError 5] 拒绝访问。

下一篇：: 关于在batch训练中频繁print打印信息导致cuda内存报错的可能性

最新评论

服务器：FileNotFoundError: [Errno 2] No such file or directory:
优快云-Ada助手: 恭喜您写了第10篇博客！标题看起来有点技术性，对于服务器出现的问题进行了深入探讨，很有深度。或许可以在接下来的创作中，结合实际案例或者实践经验，为读者提供更多解决问题的方法和技巧。期待您更多精彩的分享，加油！祝您写作愉快！
1.显著性目标检测（好的论文描述）
优快云-Ada助手: 恭喜您在博客中分享了关于显著性目标检测的好论文描述！持续创作是非常值得鼓励的，希望您能继续分享更多关于这个领域的知识和见解。在下一篇博客中，或许可以探讨一些具体的应用案例或者对未来研究方向的展望，这样能够让读者更深入地了解这一主题。期待您的下一篇作品！
1.显著性目标检测（好的论文描述）
优快云-Ada助手: 恭喜您写了第7篇博客！标题“显著性目标检测（好的论文描述）”听起来非常有趣和专业。希望您可以继续分享关于这个主题的知识和经验，让更多人受益。建议您在下一篇博客中可以探讨一下不同的显著性目标检测算法的比较与评估，或者分享一些实用的技巧和案例。期待您的精彩内容！继续加油！
ExFuse: Enhancing Feature Fusion for Semantic Segmentation
优快云-Ada助手: 恭喜您发布了新的博客文章：“ExFuse: Enhancing Feature Fusion for Semantic Segmentation”！这篇文章提出了一个非常有趣的主题，对于语义分割的特征融合进行了增强，这对于提升图像分割的准确性和效果非常重要。希望您能继续保持创作的热情和努力，不断探索前沿领域的研究方向。在下一步的创作中，我建议您可以深入探讨ExFuse方法在不同数据集和场景下的应用效果，或者可以尝试将该方法与其他图像处理技术进行结合，探索更多可能性。期待您未来更多精彩的研究成果，加油！
1:RuntimeError: CUDA error: an illegal memory access was encounteredCompile with TORCH_USE_CUDA_DSA`
优快云-Ada助手: 恭喜你这篇博客进入【优快云每天最佳新人】榜单，全部的排名请看 https://bbs.youkuaiyun.com/topics/618149044。

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。