GPU运行的时候经常会存在显存不足的情况,这里需要将其kill掉.
1. 手动逐个kill僵尸进程
可以直接用以下语句进行删除
kill -9 PID
其中的PID,可以通过下面的语句来进行查询。
nvidia-smi
如果需要动态的显示显卡的使用情况,则需要用一下的命令:
watch -n cycle nvidia-smi
注意,将其中的cycle替换为一个具体的数字,单位为s,如1
2. 批量kill特定僵尸进程
首先,我们先确认具有某关键词 %s 的僵尸进程 ,利用语句
ps aux | grep %s
然后,利用下面的语句,进行批量的kill僵尸进程(具有关键词%s)
ps -ef | grep %s | grep -v grep | awk '{print $2}'| xargs kill -9
本文介绍如何手动和批量地使用nvidia-smi工具查找并kill僵尸进程,包括直接kill PID、动态监控显卡使用情况,以及通过关键词筛选和批量kill的方法。
307

被折叠的 条评论
为什么被折叠?



