PyTorch out of memory 解决方案

博客介绍了解决模型运行时Out of Memory问题的方法。一是当运行一段时间出现该问题,可能是无用临时变量过多,可用torch.cuda.empty_cache()清理;二是若一批数据中有长句易致OOM,可跳过该句子。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

如果模型在运行了一些时间后出现的outofmemory,那么有可能是因为无用的临时变量太多了,我们需要使用torch.cuda.empty_cache()进行清理就可以了。

try:
    loss, outputs = model(src, lengths, dec, targets)
except RuntimeError as e:
    if 'out of memory' in str(e):
        print('| WARNING: ran out of memory')
        if hasattr(torch.cuda, 'empty_cache'):
            torch.cuda.empty_cache()
    else:
        raise e

如果这一批数据中有一个很长的句子容易导致oom那么就跳过这个句子

except RuntimeError as e:
    if 'out of memory' in str(e):
        print('| WARNING: ran out of memory, skipping batch')
        ooms += 1
        self.zero_grad()
    else:
        raise e
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值