Linux杀掉僵尸进程方法

本文介绍了在使用PyTorch训练模型时可能遇到的进程僵尸问题,如何通过查看进程ID和父进程ID找出僵尸进程,以及正确的方法(杀死父进程而非直接子进程)来解决GPU占用问题。
部署运行你感兴趣的模型镜像
说明:

一般在使用pytorch训练网络模型时,可能会不正确的中断训练,导致进程僵尸,GPU依然被占用的情况。


解决办法:

查看进程的ID及其父进程ID指令:

ps -ef | grep defunct | more

假设输出如下:

Tokey+  7567  2959  4 01:06 ?        00:15:03 [python] <defunct>
Tokey+  7675  2964  0 Oct18 ?        00:00:19 [python] <defunct>
Tokey+ 45815 27058  0 06:15 pts/3    00:00:00 grep --color=auto defunct

以上对应:UID PID PPID …
UID:用户ID
PID:进程ID
PPID:父进程ID

如果你使用命令 kill -9 7567 尝试杀死ID为7567的进程,可能会没效果。要想成功杀死该进程,需要对其父进程(ID为2959)执行kill命令 kill -9 2959

您可能感兴趣的与本文相关的镜像

PyTorch 2.6

PyTorch 2.6

PyTorch
Cuda

PyTorch 是一个开源的 Python 机器学习库,基于 Torch 库,底层由 C++ 实现,应用于人工智能领域,如计算机视觉和自然语言处理

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值