问题场景
训练网络时,未等网络训练完,中途按了:ctrl + c
结束网络训练。当再次进行训练网络时,提示GPU显存不足,使用nvidia-smi查看GPU,无进程占用,但GPU显存被占满。
问题分析
用ctrl + c
终止网络训练,只是终止了部分进程,还剩下一部分进程未被终止。
问题解决
1 查看进程
fuser -v /dev/nvidia*
2 终止进程
kill -9 pid
参考
- nvidia-smi 无进程占用GPU,但GPU显存却被占用了很多
- nvidia-smi无进程占用GPU,但GPU却显示不足