僵尸进程和处理

//代码参考:http://www.cnblogs.com/Anker/p/3271773.html

#include <stdio.h>
#include <unistd.h>
#include <errno.h>
#include <stdlib.h>

int main(int argc, char** argv)
{
    pid_t pid;
    pid = fork();
    if( pid < 0)
    {
        perror("fork error:");
        exit(1);
    }
    else if (pid == 0)
    {
        printf("I am child process\n");
        exit(0);
    }

    printf("i am the father\n");
    sleep(2);

    system("ps -o pid,ppid,tty,state,command");

    printf("the father exit\n");

    return 0;
}

代码解读:
僵尸进程:一个进程使用fork创建子进程,如果子进程退出,而父进程并没有调用wait或waitpid获取子进程的状态信息,那么子进程的进程描述符仍然保存在系统中。这种进程称之为僵死进程。

unix提供了一种机制可以保证只要父进程想知道子进程结束时的状态信息, 就可以得到。这种机制就是: 在每个进程退出的时候,内核释放该进程所有的资源,包括打开的文件,占用的内存等。 但是仍然为其保留一定的信息(包括进程号the process ID,退出状态the termination status of the process,运行时间the amount of CPU time taken by the process等)。直到父进程通过wait / waitpid来取时才释放。 但这样就导致了问题,如果进程不调用wait / waitpid的话, 那么保留的那段信息就不会释放,其进程号就会一直被占用,但是系统所能使用的进程号是有限的,如果大量的产生僵死进程,将因为没有可用的进程号而导致系统不能产生新的进程. 此即为僵尸进程的危害,应当避免。

//僵尸进程解决方案:
#include <stdio.h>
#include <unistd.h>
#include <errno.h>
#include <stdlib.h>
#include <signal.h>

static void signHandler(int sign);


int main()
{
    pid_t pid;

    signal(SIGCHLD, signHandler);
    pid = fork();
    if( pid < 0)
    {
        perror("fork error");
        exit(1);
    }
    else if( pid == 0)
    {
        printf("i am child process, pid id %d \n", getpid());
        exit(0);
    }

    printf(" I am father process ^_^\n");

    sleep(2);
    system("ps -o pid,ppid,state,tty,command");
    printf("father process exit\n");
    return 0;
}

static void signHandler(int signo)
{
    pid_t pid;
    int stat;

    while( (pid = waitpid(-1, &stat, WNOHANG)) > 0 )
        printf("child %d terminated \n", pid);
}

代码解读:子进程退出时向父进程发送SIGCHILD信号,父进程处理SIGCHILD信号。在信号处理函数中调用wait进行处理僵尸进程。

2 signal(sgn, func);
执行了signal()调用后,进程只要接收到类型为sign函数第一个参数的信号,不管其正在执行程序的哪一部分,
就立即执行func()函数。当func()函数执行结束后,控制权返回进程被中断的那一点继续执行。

3 waitpid 函数
pid_t waitpid(pid_t pid, int * status, int options)

1 pid > 0  只等待进程 pid 的子进程
2 pid = -1  等待任何一个子进程退出

options: WNOHAND (wait no hang), 即使没有子进程退出,立即返回,不再等待

返回值: 当正常返回, 子进程的pid;
设置 WNOHANG, 调用时发现没有子进程可退,return 0;
出错 返回 -1
<think>我们正在处理用户关于Linux/Unix系统中僵尸进程处理的问题。根据引用[3]:僵尸进程是已经结束运行但仍在进程表中存在的进程,因为父进程没有调用wait/waitpid来收集其退出状态。引用[2]提供了一些命令来查看定位僵尸进程,如:ps-aux|grepZ#查看僵尸进程ps-A-ostat,ppid,pid,cmd|grep-e'^[Zz]'#定位僵尸进程引用[1]强调了僵尸进程的影响预防的重要性。解决僵尸进程的方法主要有两种:1.让父进程调用wait/waitpid来回收子进程。这需要修改父进程的代码。2.如果父进程不会处理,可以杀死父进程(这样僵尸进程就会变成孤儿进程并被init进程回收)。但要注意,杀死父进程可能会影响服务。另外,如果僵尸进程已经产生,且其父进程是某个重要进程(如init),那么通常不需要担心,因为init会定期调用wait来清理。但如果父进程是我们自己的程序,那么我们需要修改程序。步骤:1.首先,使用命令(如上面提到的)来确认系统中是否存在僵尸进程。2.然后,根据情况处理:-如果是用户进程,可以尝试重启该父进程(先杀死父进程,再启动)。但要注意业务连续性。-修改父进程代码,添加信号处理函数(SIGCHLD)并在其中调用wait/waitpid。代码示例(C语言):#include<sys/types.h>#include<sys/wait.h>#include<signal.h>voidsigchld_handler(intsigno){while(waitpid(-1,NULL,WNOHANG)>0);//非阻塞地等待所有子进程}intmain(){signal(SIGCHLD,sigchld_handler);//...主程序逻辑}3.如果僵尸进程的父进程是init(pid=1),那么通常init会处理,但如果有大量僵尸进程,可能需要重启系统(极端情况)。注意:直接杀死僵尸进程是不可能的,因为它们已经死了。只能通过杀死父进程或让父进程回收。相关问题:1.什么是僵尸进程?它是如何产生的?2.如何检测系统中的僵尸进程?3.除了修改父进程代码,还有哪些方法可以避免僵尸进程?4.孤儿进程僵尸进程有什么区别?5.在编写多进程程序时,如何避免僵尸进程?</think>### 如何在 Linux/Unix 系统中处理僵尸进程 #### 1. **理解僵尸进程** 僵尸进程是已终止但仍占据进程表条目的进程,因父进程未调用 `wait()`/`waitpid()` 回收其退出状态而产生[^3]。特征为状态 `Z`(Zombie),不消耗 CPU/内存,但占用有限的进程 ID 资源。 #### 2. **检测僵尸进程** - **查看所有僵尸进程**: ```bash ps aux | grep 'Z' # 或精确匹配状态码 ps -A -ostat,ppid,pid,cmd | grep -e '^[Zz]' ``` - **统计数量**: ```bash ps -aux | grep Z | wc -l ``` #### 3. **解决方案** ##### (1) 终止父进程(推荐) 僵尸进程会随父进程终止而被 init 进程(PID 1)自动回收: ```bash # 找到父进程 PID ps -o ppid= -p <僵尸进程PID> # 终止父进程(SIGTERM 或 SIGKILL) kill -15 <父进程PID> # 优雅终止 kill -9 <父进程PID> # 强制终止 ``` > **注意**:若父进程是关键服务(如引用[4]的 Python 服务),需重启服务。 ##### (2) 修改父进程代码 在父进程中添加信号处理逻辑,捕获子进程退出信号: ```c #include <signal.h> #include <sys/wait.h> void sigchld_handler(int sig) { while (waitpid(-1, NULL, WNOHANG) > 0); // 非阻塞回收所有子进程 } int main() { signal(SIGCHLD, sigchld_handler); // 注册 SIGCHLD 处理器 // ... 主程序逻辑 } ``` 此方法通过自动回收子进程避免僵尸产生[^1]。 ##### (3) 特殊工具 - 使用 `reap` 工具自动回收僵尸进程(需安装): ```bash reap -d 10 # 每 10 秒清理一次 ``` #### 4. **预防措施** - **编程规范**: - 父进程必须调用 `wait()` 系列函数。 - 对 `SIGCHLD` 使用 `SA_NOCLDWAIT` 标志(Linux 特有): ```c struct sigaction sa = {0}; sa.sa_flags = SA_NOCLDWAIT; sigaction(SIGCHLD, &sa, NULL); ``` - **系统监控**: 定期检查进程状态,如通过 Cron 任务运行检测命令。 > **关键点**:僵尸进程无法直接通过 `kill` 清除[^2],必须通过父进程或系统 init 回收。长期解决方案是修复父进程代码逻辑[^3]。 --- ### 相关问题 1. **僵尸进程与孤儿进程有何区别?** (孤儿进程由 init 接管,不会变僵尸;僵尸进程是父进程未回收的终止进程) 2. **哪些场景容易导致僵尸进程?** (如父进程忽略 SIGCHLD、未实现 wait 逻辑的多进程服务器) 3. **如何监控系统中的僵尸进程数量?** (结合 `ps`、`grep` 定时任务实现自动化监控) 4. **在容器化环境(如 Docker)中处理僵尸进程有何特殊之处?** (容器 PID 命名空间隔离对僵尸进程回收的影响) 5. **为何僵尸进程不消耗资源却仍需处理?** (进程表条目有限,过量僵尸进程可能导致新进程创建失败) --- ### 引用来源 [^1]: 僵尸进程的总体影响及预防方法总结 [^2]: 僵尸进程检测与终止命令实践 [^3]: Linux 僵尸进程的产生机制与资源管理 [^4]: 僵尸进程的父进程示例(Python 服务)
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值