wait WNOHANG 僵尸进程

本文详细解释了僵尸进程的概念及其产生的原因,并提供了几种有效避免僵尸进程的方法,包括通过信号处理函数循环调用waitpid来确保所有子进程被正确回收。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

什么是僵尸进程?
首先内核会释放终止进程(调用了exit系统调用)所使用的所有存储区,关闭所有打开的文件等,但内核为每一个终止子进程保存了一定量的信息。这些信息至少包括进程ID,进程的终止状态,以及该进程使用的CPU时间,所以当终止子进程的父进程调用wait或waitpid时就可以得到这些信息。
而僵尸进程就是指:一个进程执行了exit系统调用退出,而其父进程并没有为它收尸(调用wait或waitpid来获得它的结束状态)的进程。
任何一个子进程(init除外)在exit后并非马上就消失,而是留下一个称外僵尸进程的数据结构,等待父进程处理。这是每个子进程都必需经历的阶段。另外子进程退出的时候会向其父进程发送一个SIGCHLD信号。
如何避免僵尸进程
通过signal(SIGCHLD, SIG_IGN)通知内核对子进程的结束不关心,由内核回收
父进程调用wait/waitpid等函数等待子进程结束,如果尚无子进程退出wait会导致父进程阻塞。waitpid可以通过传递WNOHANG使父进程不阻塞立即返回。
如果父进程很忙可以用signal注册信号处理函数,在信号处理函数调用wait/waitpid等待子进程退出。
通过两次调用fork。父进程首先调用fork创建一个子进程然后waitpid等待子进程退出,子进程再fork一个孙进程后退出。这样子进程退出后会被父进程等待回收,而对于孙子进程其父进程已经退出所以孙进程成为一个孤儿进程,孤儿进程由init进程接管,孙进程结束后,init会等待回收。
如以下代码会创建100个子进程,但是父进程并未等待它们结束,所以在父进程退出前会有100个僵尸进程。
C
#include <stdio.h>
#include <unistd.h>
 
int main() {
 
  int i;
  pid_t pid;
 
  for(i=0; i<100; i++) {
    pid = fork();
    if(pid == 0)
      break;
  }
 
  if(pid>0) {
    printf("press Enter to exit...");
    getchar();
  }
 
  return 0;
}
其中一个解决方法即是编写一个SIGCHLD信号处理程序来调用wait/waitpid来等待子进程返回。
C
#include <stdio.h>
#include <unistd.h>
#include <signal.h>
#include <sys/types.h>
#include <sys/wait.h>
 
void wait4children(int signo) {
 
  int status;
  wait(&status);
 
}
 
int main() {
 
  int i;
  pid_t pid;
 
  signal(SIGCHLD, wait4children);
 
  for(i=0; i<100; i++) {
    pid = fork();
    if(pid == 0)
      break;
  }
 
  if(pid>0) {
    printf("press Enter to exit...");
    getchar();
  }
 
  return 0;
}
但是通过运行程序发现还是会有僵尸进程,而且每次僵尸进程的数量都不定。这是为什么呢?其实主要是因为Linux的信号机制是不排队的,假如在某一时间段多个子进程退出后都会发出SIGCHLD信号,但父进程来不及一个一个地响应,所以最后父进程实际上只执行了一次信号处理函数。但执行一次信号处理函数只等待一个子进程退出,所以最后会有一些子进程依然是僵尸进程。
虽然这样但是有一点是明了的,就是收到SIGCHLD必然有子进程退出,而我们可以在信号处理函数里循环调用waitpid函数来等待所有的退出的子进程。至于为什么不用wait,主要原因是在wait在清理完所有僵尸进程后再次等待会阻塞。
所以最佳方案(个人观点)如下:
C
#include <stdio.h>
#include <unistd.h>
#include <signal.h>
#include <errno.h>
#include <sys/types.h>
#include <sys/wait.h>
 
void wait4children(int signo) {
  int status;
  while(waitpid(-1, &status, WNOHANG) > 0);
}
 
int main() {
 
  int i;
  pid_t pid;
 
  signal(SIGCHLD, wait4children);
 
  for(i=0; i<100; i++) {
    pid = fork();
    if(pid == 0)
      break;
  }
 
  if(pid>0) {
    printf("press Enter to exit...");
    getchar();
  }
 
  return 0;
}
<think>我们正在处理用户关于Linux/Unix系统中僵尸进程处理的问题。根据引用[3]:僵尸进程是已经结束运行但仍在进程表中存在的进程,因为父进程没有调用wait/waitpid来收集其退出状态。引用[2]提供了一些命令来查看和定位僵尸进程,如:ps-aux|grepZ#查看僵尸进程ps-A-ostat,ppid,pid,cmd|grep-e'^[Zz]'#定位僵尸进程引用[1]强调了僵尸进程的影响和预防的重要性。解决僵尸进程的方法主要有两种:1.让父进程调用wait/waitpid来回收子进程。这需要修改父进程的代码。2.如果父进程会处理,可以杀死父进程(这样僵尸进程就会变成孤儿进程并被init进程回收)。但要注意,杀死父进程可能会影响服务。另外,如果僵尸进程已经产生,且其父进程是某个重要进程(如init),那么通常需要担心,因为init会定期调用wait来清理。但如果父进程是我们自己的程序,那么我们需要修改程序。步骤:1.首先,使用命令(如上面提到的)来确认系统中是否存在僵尸进程。2.然后,根据情况处理:-如果是用户进程,可以尝试重启该父进程(先杀死父进程,再启动)。但要注意业务连续性。-修改父进程代码,添加信号处理函数(SIGCHLD)并在其中调用wait/waitpid。代码示例(C语言):#include<sys/types.h>#include<sys/wait.h>#include<signal.h>voidsigchld_handler(intsigno){while(waitpid(-1,NULL,WNOHANG)>0);//非阻塞地等待所有子进程}intmain(){signal(SIGCHLD,sigchld_handler);//...主程序逻辑}3.如果僵尸进程父进程是init(pid=1),那么通常init会处理,但如果有大量僵尸进程,可能需要重启系统(极端情况)。注意:直接杀死僵尸进程可能的,因为它们已经死了。只能通过杀死父进程或让父进程回收。相关问题:1.什么是僵尸进程?它是如何产生的?2.如何检测系统中的僵尸进程?3.除了修改父进程代码,还有哪些方法可以避免僵尸进程?4.孤儿进程和僵尸进程有什么区别?5.在编写多进程程序时,如何避免僵尸进程?</think>### 如何在 Linux/Unix 系统中处理僵尸进程 #### 1. **理解僵尸进程** 僵尸进程是已终止但仍占据进程表条目的进程,因父进程未调用 `wait()`/`waitpid()` 回收其退出状态而产生[^3]。特征为状态 `Z`(Zombie),消耗 CPU/内存,但占用有限的进程 ID 资源。 #### 2. **检测僵尸进程** - **查看所有僵尸进程**: ```bash ps aux | grep 'Z' # 或精确匹配状态码 ps -A -ostat,ppid,pid,cmd | grep -e '^[Zz]' ``` - **统计数量**: ```bash ps -aux | grep Z | wc -l ``` #### 3. **解决方案** ##### (1) 终止父进程(推荐) 僵尸进程会随父进程终止而被 init 进程(PID 1)自动回收: ```bash # 找到父进程 PID ps -o ppid= -p <僵尸进程PID> # 终止父进程(SIGTERM 或 SIGKILL) kill -15 <父进程PID> # 优雅终止 kill -9 <父进程PID> # 强制终止 ``` > **注意**:若父进程是关键服务(如引用[4]的 Python 服务),需重启服务。 ##### (2) 修改父进程代码 在父进程中添加信号处理逻辑,捕获子进程退出信号: ```c #include <signal.h> #include <sys/wait.h> void sigchld_handler(int sig) { while (waitpid(-1, NULL, WNOHANG) > 0); // 非阻塞回收所有子进程 } int main() { signal(SIGCHLD, sigchld_handler); // 注册 SIGCHLD 处理器 // ... 主程序逻辑 } ``` 此方法通过自动回收子进程避免僵尸产生[^1]。 ##### (3) 特殊工具 - 使用 `reap` 工具自动回收僵尸进程(需安装): ```bash reap -d 10 # 每 10 秒清理一次 ``` #### 4. **预防措施** - **编程规范**: - 父进程必须调用 `wait()` 系列函数。 - 对 `SIGCHLD` 使用 `SA_NOCLDWAIT` 标志(Linux 特有): ```c struct sigaction sa = {0}; sa.sa_flags = SA_NOCLDWAIT; sigaction(SIGCHLD, &sa, NULL); ``` - **系统监控**: 定期检查进程状态,如通过 Cron 任务运行检测命令。 > **关键点**:僵尸进程无法直接通过 `kill` 清除[^2],必须通过父进程或系统 init 回收。长期解决方案是修复父进程代码逻辑[^3]。 --- ### 相关问题 1. **僵尸进程与孤儿进程有何区别?** (孤儿进程由 init 接管,会变僵尸;僵尸进程父进程未回收的终止进程) 2. **哪些场景容易导致僵尸进程?** (如父进程忽略 SIGCHLD、未实现 wait 逻辑的多进程服务器) 3. **如何监控系统中的僵尸进程数量?** (结合 `ps`、`grep` 和定时任务实现自动化监控) 4. **在容器化环境(如 Docker)中处理僵尸进程有何特殊之处?** (容器 PID 命名空间隔离对僵尸进程回收的影响) 5. **为何僵尸进程消耗资源却仍需处理?** (进程表条目有限,过量僵尸进程可能导致新进程创建失败) --- ### 引用来源 [^1]: 僵尸进程的总体影响及预防方法总结 [^2]: 僵尸进程检测与终止命令实践 [^3]: Linux 僵尸进程的产生机制与资源管理 [^4]: 僵尸进程父进程示例(Python 服务)
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值