RuntimeError: CUDA error: out of memory
CUDA kernel errors might be asynchronously reported at some other API call,so the stacktrace below might be incorrect.
For debugging consider passing CUDA_LAUNCH_BLOCKING=1.
出现此错误并不是调整batchsize或者with torch.no_grad():能解决问题,出现此问题是nvidia的GPU会出现假释放内存bug,看上去释放了,实则没有释放。
解决办法:关闭进程,或者电脑关机,若使用租用的云,联系客服处理。
博客内容提及了一个常见的CUDA编程问题——CUDA out of memory 错误。此错误并非简单通过调整batch size或使用torch.no_grad()即可解决,因为可能是由于NVIDIA GPU的内存释放bug导致。解决方案建议包括关闭相关进程,重启计算机,或在云服务环境下联系客服协助处理。博客重点讨论了CUDA内存管理和调试的挑战。
1万+





