1. RuntimeError: cuDNN error: CUDNN_STATUS_INTERNAL_ERROR
有博主说清理缓存 rm -rf ~/.nv 但我这里不work。
还有博客说可能是内存不够,然后去试了多gpu,发现可。
2. RuntimeError: CUDA out of memory. Tried to allocate 1.75 MiB (GPU 0; 11.17 GiB total capacity; 3.34 GiB already allocated; 768.00 KiB free; 35.32 MiB cached)
不要在循环训练中累计历史纪录
total loss +=loss
改为 total loss += float(loss)
我这里可work。
本文探讨了CUDA运行时错误:cuDNN内部错误与内存不足的问题,并提供了解决方案。针对cuDNN错误,尝试了清理缓存但未奏效,最终通过使用多GPU解决了问题。对于内存溢出,建议不在训练循环中累积损失,而应将损失转换为浮点数再累加,此方法有效。
4485

被折叠的 条评论
为什么被折叠?



