1.僵尸进程概念
僵尸进程(Zombie Process):就是已经结束了的进程,但是没有从进程表中删除。太多了会导致进程表里面条目满了,进而导致系统崩溃,倒是不占用其他系统资源。
在Linux进程的状态中,僵尸进程是非常特殊的一种,它已经放弃了几乎所有内存空间,没有任何可执行代码,也不能被调度,仅仅在进程列表中保留一个位置,记载该进程的退出状态等信息供其他进程收集,除此之外,僵尸进程不再占有任何内存空间。它需要它的父进程来为它收尸,如果他的父进程没安装SIGCHLD信号处理函数调用wait或waitpid()等待子进程结束,又没有显式忽略该信号,那么它就一直保持僵尸状态,如果这时父进程结束了,那么init进程自动会接手这个子进程,为它收尸,它还是能被清除的。但是如果如果父进程是一个循环,不会结束,那么子进程就会一直保持僵尸状态,这就是为什么系统中有时会有很多的僵尸进程。
父进程死后僵尸进程成为"孤儿进程"
2.僵尸进程产生的原因
每个Linux进程在进程表里都有一个进入点(entry),核心程序执行该进程时使用到的一切信息都存储在进入点。当用 ps 命令察看系统中的进程信息时,看到的就是进程表中的相关数据。当以fork()系统调用建立一个新的进程后,核心进程就会在进程表中给这个新进程分配一个进入点,然后将相关信息存储在该进入点所对应的进程表内。这些信息中有一项是其父进程的识别码。当这个进程走完了自己的生命周期后,它会执行exit()系统调用,此时原来进程表中的数据会被该进程的退出码(exit code)、执行时所用的CPU时间等数据所取代,这些数据会一直保留到系统将它传递给它的父进程为止。由此可见,defunct(僵尸)进程的出现时间是在子进程终止后,但是父进程尚未读取这些数据之前。
3.僵尸进程的查看
用 top 命令,可以看到
Tasks: 123 total, 1 running, 122 sleeping, 0 stopped, 0 zombie
zombie前面的数量就是僵尸进程到数量;
ps -ef
出现:
root 13028 12956 0 10:51 pts/2 00:00:00 [ls]
最后有 defunct 的标记,就表明是僵尸进程。
4.僵尸进程解决办法
1、 改写父进程,在子进程死后要为它收尸。具体做法是接管SIGCHLD信号。子进程死后,会发送SIGCHLD信号给父进程,父进程收到此信号后,执行 waitpid() 函数为子进程收尸。这是基于这样的原理:就算父进程没有调用wait,内核也会向它发送SIGCHLD消息,尽管对的默认处理是忽略,如果想响应这个消息,可以设置一个处理函数。
2、把父进程杀掉。父进程死后,僵尸进程成为"孤儿进程",过继给1号进程init,init始终会负责清理僵尸进程.它产生的所有僵尸进程也跟着消失。
kill -9 `ps -ef | grep "Process Name" | awk '{ print $3 }'`
其中,“Process Name”为处于zombie状态的进程名。
3、杀父进程不行的话,就尝试用 skill -t TTY 关闭相应终端,TTY是进程相应的tty号(终端号)。但是,ps可能会查不到特定进程的tty号,这时就需要自己判断了。
4、实在不行,重启系统吧,这也是最常用到方法之一。
5.僵尸进程实例
/*-----zombie1.c-----*/
#include <sys/types.h>
#include <sys/wait.h>
#include <unistd.h>
#include <stdio.h>
int main(int argc, char *argv[])
{
while (1)
{
pid_t child = fork();
if (child == 0)
execl("/bin/bash", "bash", "-c", "ls", NULL);
sleep(3);
}
return 0;
}
会不停地产生僵死进程ls;
运行例子:
先 gcc zombie1.c -o zombie 编译,然后运行 ./zombie;
然后可以可用 top 命令来查看是否产生了僵尸进程。
/*-----zombie2.c-----*/
#include <sys/types.h>
#include <unistd.h>
#include <stdlib.h>
#include <stdio.h>
int main(int argc, char *argv[])
{
if (fork() == 0)
{
printf("child pid = %d\n", getpid());
exit(0);
}
//wait();
//waitpid(-1, NULL, 0);
sleep(60);
printf("parent pid = %d\n", getpid());
exit(0);
return 0;
}
60s内会不断产生僵尸进程,直到父进程exit(0);
如果在调用wait/waitpid来为子进程收尸,就不会产生僵尸进程了。
僵尸进程和孤儿进程的区别:
僵尸进程:当前进程运行结束父进程未结束且父进程没有调用 wait 来清理子进程
孤儿进程:当前进程结束且父进程在它之前结束,这时子进程被“托孤”于 init 进程
其他知识:
execl:进程进入了shell环境执行,执行完进程结束
system = fork + exec + waitpid:执行完进程仍然存在,只是用它的子进程执行了操作。