python吃显卡还是内存不足_解决Pytorch 训练与测试时爆显存(out of memory)的问题

本文介绍了解决PyTorch训练与测试过程中遇到的显存溢出问题的方法。包括使用torch.cuda.empty_cache()释放缓存及确保在测试阶段正确使用with torch.no_grad()避免不必要的梯度计算。
部署运行你感兴趣的模型镜像

Pytorch 训练时有时候会因为加载的东西过多而爆显存,有些时候这种情况还可以使用cuda的清理技术进行修整,当然如果模型实在太大,那也没办法。

使用torch.cuda.empty_cache()删除一些不需要的变量代码示例如下:

try:

output = model(input)

except RuntimeError as exception:

if "out of memory" in str(exception):

print("WARNING: out of memory")

if hasattr(torch.cuda, 'empty_cache'):

torch.cuda.empty_cache()

else:

raise exception

测试的时候爆显存有可能是忘记设置no_grad, 示例代码如下:

with torch.no_grad():

for ii,(inputs,filelist) in tqdm(enumerate(test_loader), desc='predict'):

if opt.use_gpu:

inputs = inputs.cuda()

if len(inputs.shape) < 4:

inputs = inputs.unsqueeze(1)

else:

if len(inputs.shape) < 4:

inputs = torch.transpose(inputs, 1, 2)

inputs = inputs.unsqueeze(1)

以上这篇解决Pytorch 训练与测试时爆显存(out of memory)的问题就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持脚本之家。

您可能感兴趣的与本文相关的镜像

PyTorch 2.6

PyTorch 2.6

PyTorch
Cuda

PyTorch 是一个开源的 Python 机器学习库,基于 Torch 库,底层由 C++ 实现,应用于人工智能领域,如计算机视觉和自然语言处理

在复现 PointNet++ 模型,遇到的 `RuntimeError: CUDA out of memory` 错误通常是由于模型计算过程中显存需求超过了 GPU 的可用容量所致。该问题可能由批量大小、模型结构复杂度、中间变量存储等因素引起。 ### 常见原因及解决方案 #### 1. **降低批量大小(Batch Size)** PointNet++ 在处理点云数据,每个样本可能包含大量点(如 4096 点或更多),因此较大的批量会显著增加显存占用。可以尝试将训练测试阶段的批量大小设置为较小值(例如 1 或 2),以缓解内存压力。 ```python # 示例:修改配置文件中的 batch size batch_size = 1 # 减小 batch size 可有效减少显存使用 ``` #### 2. **优化点采样特征提取策略** PointNet++ 中的多尺度分层结构会导致显存占用迅速增长,尤其是在多个集合抽象(Set Abstraction)层中同保留大量点的情况下。可以通过以下方式优化: - **限制每层保留的点数**:在 Set Abstraction 层中适当减少采样点数量。 - **调整半径搜索参数**:减小球查询中的半径(radius)和邻域点数(nsample)[^1]。 ```python class PointNetSetAbstraction(nn.Module): def __init__(self, npoint, radius, nsample, in_channel, mlp, group_all): super().__init__() self.npoint = npoint # 减少此值可降低显存消耗 self.radius = radius # 可适当调小 self.nsample = nsample # 减少邻域点数 ... ``` #### 3. **启用混合精度训练(Mixed Precision Training)** 使用 PyTorch 的自动混合精度(AMP)功能可以显著降低显存使用,并加快训练速度。 ```python from torch.cuda.amp import autocast, GradScaler scaler = GradScaler() with autocast(): outputs = model(inputs) loss = criterion(outputs, labels) scaler.scale(loss).backward() scaler.step(optimizer) scaler.update() ``` #### 4. **释放不必要的张量缓存** 在模型推理或训练过程中,如果存在未及释放的中间张量或损失记录,也可能导致显存溢出。建议定期调用以下命令清理缓存[^4]。 ```python import gc import torch def release_gpu_memory(): gc.collect() torch.cuda.empty_cache() ``` #### 5. **检查是否因调试代码造成显存泄漏** 有调试代码中将 GPU 张量不断添加到 Python 列表中(如 `losses.append(loss)`),也会导致显存耗尽。应避免在循环中长期持有 GPU 张量引用[^5]。 #### 6. **使用更高效的实现版本** 部分开源实现可能存在冗余计算或不合理的内存分配策略。可尝试使用经过优化的 PointNet++ 实现版本,或者参考官方实现进行结构调整。 --- ### 总结 | 方法 | 描述 | |------|------| | 调整批量大小 | 显著影响显存使用,推荐优先尝试 | | 优化 SA 层参数 | 减少采样点数和邻域点数 | | 启用混合精度 | 提高效率并降低显存占用 | | 清理缓存 | 避免内存碎片化 | | 检查调试代码 | 防止因临变量累积导致溢出 | | 使用高效实现 | 替换为优化后的模型实现 | ---
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值