在模型进行inference的时候爆显存

在模型训练与推理过程中,因改变特征计算流程致CUDA显存不足。原以为model.eval()能停止梯度计算,实则仅禁用BN与Dropout。通过加入torch.set_grad_enabled(False)有效降低显存消耗。
部署运行你感兴趣的模型镜像

使用相同的参数进行模型的训练和inference。但居然在inference时出现:

RuntimeError: CUDA out of memory

后来发现可能是由于改变了inference出来的特征之后的计算过程,导致使用了更多的显存来计算梯度。原来计算出特征之后直接去算loss,而在inference时计算出特征之后是一些其他的操作。

之前以为model.eval()就可以停止计算梯度,但事实上model.eval()貌似只有禁用BatchNormalization和Dropout的功能。

在代码中加入torch.set_grad_enabled(False)后显存就够用了。

您可能感兴趣的与本文相关的镜像

PyTorch 2.6

PyTorch 2.6

PyTorch
Cuda

PyTorch 是一个开源的 Python 机器学习库,基于 Torch 库,底层由 C++ 实现,应用于人工智能领域,如计算机视觉和自然语言处理

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值