僵尸进程

参考:
https://www.zhihu.com/question/26432067
https://baike.baidu.com/item/%E5%83%B5%E5%B0%B8%E8%BF%9B%E7%A8%8B/1036577?fr=aladdin
由于子进程的结束和父进程的运行是一个异步过程,即父进程永远无法预测子进程 到底什么时候结束. 那么会不会因为父进程太忙来不及wait子进程,
或者说不知道 子进程什么时候结束,而丢失子进程结束时的状态信息呢? 不会。因为UNⅨ提供了一种机制可以保证只要父进程想知道子进程结束时的状态信息,
就可以得到。这种机制就是: 在每个进程退出的时候,内核释放该进程所有的资源,包括打开的文件,占用的内存等。
但是仍然为其保留一定的信息(包括进程号the process ID,退出状态the termination status of the process,运行时间the amount of CPU time taken by the process等)。
直到父进程通过wait / waitpid来取时才释放. 但这样就导致了问题,如果进程不调用wait / waitpid的话,那么保留的那段信息就不会释放,其进程号就会一直被占用,
但是系统所能使用的进程号是有限的,如果大量的产生僵死进程,将因为没有可用的进程号而导致系统不能产生新的进程. 此即为僵尸进程的危害,应当避免。

它需要它的父进程来为它收尸,如果它的父进程没安装SIGCHLD信号处理函数调用wait或waitpid()等待子进程结束,又没有显式忽略该信号,那么它就一直保持僵尸状态;
存在的问题:如果父进程是一个循环,不会结束,那么子进程就会一直保持僵尸状态,这就是为什么系统中有时会有很多的僵尸进程,系统的性能可能会受到影响。
如果这时父进程结束了,那么init进程会自动接手这个子进程,为它收尸,它还是能被清除的。4、子进程结束后为什么要进入僵尸状态? 因为父进程可能要取得子进程的退出状态等信息。
5、僵尸状态是每个子进程必经的状态吗? 是的。 任何一个子进程(init除外)在exit()之后,并非马上就消失掉,而是留下一个称为僵尸进程(Zombie)的数据结构,等待父进程处理。
这是每个子进程在结束时都要经过的阶段。如果子进程在exit()之后,父进程没有来得及处理,这时用ps命令就能看到子进程的状态是“Z”。如果父进程能及时 处理,
可能用ps命令就来不及看到子进程的僵尸状态,但这并不等于子进程不经过僵尸状态。 * 如果父进程在子进程结束之前退出,则子进程将由init接管。
init将会以父进程的身份对僵尸状态的子进程进行处理。
6、如何查看僵尸进程: $ ps -el 其中,有标记为Z的进程就是僵尸进程 S代表休眠状态;D代表不可中断的休眠状态;R代表运行状态;Z代表僵死状态;T代表停止或跟踪状态


在fork()/execve()过程中,假设子进程结束时父进程仍存在,而父进程fork()之前既没安装SIGCHLD信号处理函数调用waitpid()等待子进程结束,又没有显式忽略该信号,则子进程成为僵尸进程,无法正常结束,
此时即使是root身份kill -9也不能杀死僵尸进程。

补救办法:
例如有个进程,它定期的产 生一个子进程,这个子进程需要做的事情很少,做完它该做的事情之后就退出了,因此这个子进程的生命周期很短,
但是,父进程只管生成新的子进程,至于子进程 退出之后的事情,则一概不闻不问,这样,系统运行上一段时间之后,系统中就会存在很多的僵死进程,
倘若用ps命令查看的话,就会看到很多状态为Z的进程。 严格地来说,僵死进程并不是问题的根源,罪魁祸首是产生出大量僵死进程的那个父进程。
因此,当我们寻求如何消灭系统中大量的僵死进程时,答案就是把产生大 量僵死进程的那个元凶枪毙掉(也就是通过kill发送SIGTERM或者SIGKILL信号啦)。
枪毙了元凶进程之后,它产生的僵死进程就变成了孤儿进 程,这些孤儿进程会被init进程接管,init进程会wait()这些孤儿进程,
释放它们占用的系统进程表中的资源,这样,这些已经僵死的孤儿进程 就能瞑目而去了。

僵尸进程的避免:
⒈父进程通过wait和waitpid等函数等待子进程结束,这会导致父进程挂起。
⒉ 如果父进程很忙,那么可以用signal函数为SIGCHLD安装handler,因为子进程结束后, 父进程会收到该信号,可以在handler中调用wait回收。
⒊ 如果父进程不关心子进程什么时候结束,那么可以用signal(SIGCHLD,SIG_IGN) 通知内核,自己对子进程的结束不感兴趣,那么子进程结束后,内核会回收, 并不再给父进程发送信号。
⒋ 还有一些技巧,就是fork两次,父进程fork一个子进程,然后继续工作,子进程fork一 个孙进程后退出,那么孙进程被init接管,孙进程结束后,init会回收。不过子进程的回收 还要自己做。

产生过程:
一个进程在调用exit命令结束自己的生命的时候,其实
linux中的僵尸进程
linux中的僵尸进程
它并没有真正的被销毁,而是留下一个称为僵尸进程(Zombie)的数据结构(系统调用exit,它的作用是使进程退出,但也仅仅限于将一个正常的进程变成一个僵尸进程,并不能将其完全销毁)。
在Linux进程的状态中,僵尸进程是非常特殊的一种,它已经放弃了几乎所有内存空间,没有任何可执行代码,也不能被调度,仅仅在进程列表中保留一个位置,
记载该进程的退出状态等信息供其他进程收集,除此之外,僵尸进程不再占有任何内存空间。它需要它的父进程来为它收尸,
如果他的父进程没安装SIGCHLD信号处理函数调用wait或waitpid()等待子进程结束,又没有显式忽略该信号,那么它就一直保持僵尸状态,如果这时父进程结束了,
那么init进程自动会接手这个子进程,为它收尸,它还是能被清除的。
但是如果父进程是一个循环,不会结束,那么子进程就会一直保持僵尸状态,这就是为什么系统中有时会有很多的僵尸进程。

具体避免僵尸进程方法:
1)在SVR4中,如果调用signal或sigset将SIGCHLD的配置设置为忽略,则不会产生僵死子进程。另外,使用SVR4版的sigaction,则可设置SA_NOCLDWAIT标志以避免子进程僵死。
Linux中也可使用这个,在一个程序的开始调用这个函数
signal(SIGCHLD,SIG_IGN);
2)调用fork两次。
3)用waitpid等待子进程返回.


defunct进程只是在process table里还有一个记录,其他的资源没有占用,除非你的系统的process个数的限制已经快超过了,zombie进程不会有更多的坏处。

 

fork两次:
(如果父进程不需要通过pid管理子进程,那么fork一次,然后wait,再让fork出来的子进程fork一个孙子进程出来,然后子进程自杀,
然后父进程通过wait回收子进程,此时孙子进程直接被init进程收养,死了自动回收。如果需要通过pid管理,那只能用waitpid之类的调用来人为回收结束的子进程.
,原理是将子进程变成为孤儿进程,从而其的父进程变为init进程,通过init进程可以处理僵尸进程。)

#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <errno.h>

int main()
{
pid_t pid;
//创建第一个子进程
pid = fork();
if (pid < 0)
{
perror("fork error:");
exit(1);
}
//第一个子进程
else if (pid == 0)
{
//子进程再创建子进程
printf("I am the first child process.pid:%d\tppid:%d\n",getpid(),getppid());
pid = fork();
if (pid < 0)
{
perror("fork error:");
exit(1);
}
//第一个子进程退出
else if (pid >0)
{
printf("first procee is exited.\n");
exit(0);
}
//第二个子进程
//睡眠3s保证第一个子进程退出,这样第二个子进程的父亲就是init进程里
sleep(3);
printf("I am the second child process.pid: %d\tppid:%d\n",getpid(),getppid());
exit(0);
}
//父进程处理第一个子进程退出
if (waitpid(pid, NULL, 0) != pid)
{
perror("waitepid error:");
exit(1);
}
exit(0);
return 0;
}


通过信号机制
子进程退出时向父进程发送SIGCHILD信号,父进程处理SIGCHILD信号。在信号处理函数中调用wait进行处理僵尸进程。测试程序如下所示:
#include <stdio.h>
#include <unistd.h>
#include <errno.h>
#include <stdlib.h>
#include <signal.h>

static void sig_child(int signo);

int main()
{
pid_t pid;
//创建捕捉子进程退出信号
signal(SIGCHLD,sig_child);
pid = fork();
if (pid < 0)
{
perror("fork error:");
exit(1);
}
else if (pid == 0)
{
printf("I am child process,pid id %d.I am exiting.\n",getpid());
exit(0);
}
printf("I am father process.I will sleep two seconds\n");
//等待子进程先退出
sleep(2);
//输出进程信息
system("ps -o pid,ppid,state,tty,command");
printf("father process is exiting.\n");
return 0;
}

static void sig_child(int signo)
{
pid_t pid;
int stat;
//处理僵尸进程
while ((pid = waitpid(-1, &stat, WNOHANG)) >0)
printf("child %d terminated.\n", pid);
}

 

转载于:https://www.cnblogs.com/zhangxuan/p/8716190.html

<think>我们正在处理用户关于Linux/Unix系统中僵尸进程处理的问题。根据引用[3]:僵尸进程是已经结束运行但仍在进程表中存在的进程,因为父进程没有调用wait/waitpid来收集其退出状态。引用[2]提供了一些命令来查看和定位僵尸进程,如:ps-aux|grepZ#查看僵尸进程ps-A-ostat,ppid,pid,cmd|grep-e'^[Zz]'#定位僵尸进程引用[1]强调了僵尸进程的影响和预防的重要性。解决僵尸进程的方法主要有两种:1.让父进程调用wait/waitpid来回收子进程。这需要修改父进程的代码。2.如果父进程不会处理,可以杀死父进程(这样僵尸进程就会变成孤儿进程并被init进程回收)。但要注意,杀死父进程可能会影响服务。另外,如果僵尸进程已经产生,且其父进程是某个重要进程(如init),那么通常不需要担心,因为init会定期调用wait来清理。但如果父进程是我们自己的程序,那么我们需要修改程序。步骤:1.首先,使用命令(如上面提到的)来确认系统中是否存在僵尸进程。2.然后,根据情况处理:-如果是用户进程,可以尝试重启该父进程(先杀死父进程,再启动)。但要注意业务连续性。-修改父进程代码,添加信号处理函数(SIGCHLD)并在其中调用wait/waitpid。代码示例(C语言):#include<sys/types.h>#include<sys/wait.h>#include<signal.h>voidsigchld_handler(intsigno){while(waitpid(-1,NULL,WNOHANG)>0);//非阻塞地等待所有子进程}intmain(){signal(SIGCHLD,sigchld_handler);//...主程序逻辑}3.如果僵尸进程父进程是init(pid=1),那么通常init会处理,但如果有大量僵尸进程,可能需要重启系统(极端情况)。注意:直接杀死僵尸进程是不可能的,因为它们已经死了。只能通过杀死父进程或让父进程回收。相关问题:1.什么是僵尸进程?它是如何产生的?2.如何检测系统中的僵尸进程?3.除了修改父进程代码,还有哪些方法可以避免僵尸进程?4.孤儿进程和僵尸进程有什么区别?5.在编写多进程程序时,如何避免僵尸进程?</think>### 如何在 Linux/Unix 系统中处理僵尸进程 #### 1. **理解僵尸进程** 僵尸进程是已终止但仍占据进程表条目的进程,因父进程未调用 `wait()`/`waitpid()` 回收其退出状态而产生[^3]。特征为状态 `Z`(Zombie),不消耗 CPU/内存,但占用有限的进程 ID 资源。 #### 2. **检测僵尸进程** - **查看所有僵尸进程**: ```bash ps aux | grep 'Z' # 或精确匹配状态码 ps -A -ostat,ppid,pid,cmd | grep -e '^[Zz]' ``` - **统计数量**: ```bash ps -aux | grep Z | wc -l ``` #### 3. **解决方案** ##### (1) 终止父进程(推荐) 僵尸进程会随父进程终止而被 init 进程(PID 1)自动回收: ```bash # 找到父进程 PID ps -o ppid= -p <僵尸进程PID> # 终止父进程(SIGTERM 或 SIGKILL) kill -15 <父进程PID> # 优雅终止 kill -9 <父进程PID> # 强制终止 ``` > **注意**:若父进程是关键服务(如引用[4]的 Python 服务),需重启服务。 ##### (2) 修改父进程代码 在父进程中添加信号处理逻辑,捕获子进程退出信号: ```c #include <signal.h> #include <sys/wait.h> void sigchld_handler(int sig) { while (waitpid(-1, NULL, WNOHANG) > 0); // 非阻塞回收所有子进程 } int main() { signal(SIGCHLD, sigchld_handler); // 注册 SIGCHLD 处理器 // ... 主程序逻辑 } ``` 此方法通过自动回收子进程避免僵尸产生[^1]。 ##### (3) 特殊工具 - 使用 `reap` 工具自动回收僵尸进程(需安装): ```bash reap -d 10 # 每 10 秒清理一次 ``` #### 4. **预防措施** - **编程规范**: - 父进程必须调用 `wait()` 系列函数。 - 对 `SIGCHLD` 使用 `SA_NOCLDWAIT` 标志(Linux 特有): ```c struct sigaction sa = {0}; sa.sa_flags = SA_NOCLDWAIT; sigaction(SIGCHLD, &sa, NULL); ``` - **系统监控**: 定期检查进程状态,如通过 Cron 任务运行检测命令。 > **关键点**:僵尸进程无法直接通过 `kill` 清除[^2],必须通过父进程或系统 init 回收。长期解决方案是修复父进程代码逻辑[^3]。 --- ### 相关问题 1. **僵尸进程孤儿进程有何区别?** (孤儿进程由 init 接管,不会变僵尸;僵尸进程父进程未回收的终止进程) 2. **哪些场景容易导致僵尸进程?** (如父进程忽略 SIGCHLD、未实现 wait 逻辑的多进程服务器) 3. **如何监控系统中的僵尸进程数量?** (结合 `ps`、`grep` 和定时任务实现自动化监控) 4. **在容器化环境(如 Docker)中处理僵尸进程有何特殊之处?** (容器 PID 命名空间隔离对僵尸进程回收的影响) 5. **为何僵尸进程不消耗资源却仍需处理?** (进程表条目有限,过量僵尸进程可能导致新进程创建失败) --- ### 引用来源 [^1]: 僵尸进程的总体影响及预防方法总结 [^2]: 僵尸进程检测终止命令实践 [^3]: Linux 僵尸进程的产生机制资源管理 [^4]: 僵尸进程父进程示例(Python 服务)
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值