僵尸进程

为什么有僵尸进程

设置僵死状态的目的是维护子进程的信息,以便父进程在以后某个时候获取。这些信息至少包括进程ID,进程的终止状态,以及该进程使用的CPU时间,所以当终止子进程的父进程调用wait或waitpid时就可以得到这些信息。

有些unix系统在ps命令输出的COMMAND栏以defunct指示僵死进程。

什么是僵死进程

当进程死亡时,内核会释放终止进程(调用了exit系统调用)所使用的所有存储区,关闭所有打开的文件等,但内核为每一个终止子进程保存了一定量的信息。这些信息至少包括进程ID,进程的终止状态,以及该进程使用的CPU时间,所以当终止子进程的父进程调用wait或waitpid时就可以得到这些信息。

处理僵死进程

内核在任何一个进程终止时会发给它的父进程一个信号,这个信号就是SIGCHLD。
所以,建立俘获SIGCHLD信号的信号处理函数来处理僵死进程

void sig_chld(int signo) {
    pid_t pid;
    int stat;
    pid = wait(&stat);
}

但是,wait有个问题,如果没有已终止的子进程,却有一个或多个子进程仍在进行,wait将阻塞到有一个子进程终止为止。
waitpid则不会。

/* 成功返回终止的子进程pid,失败返回-1或者0 */
pid_t waitpid(pid_t pid, int *statloc, int options);

所以,修正后的sig_chld函数是

void sig_child(int signo) {
    pid_t pid;
    int stat;
    while ((pid = waitpid(-1, &stat, WNOHANG)) > 0);
}

while循环是获取所有已终止子进程的状态,值-1表示等待第一个终止的子进程,WHNOHANG表示当没有已经终止的子进程时不要阻塞。

最后,在listen监听后,调用signal(SIGCHLD, sig_child),就避免出现僵死进程。

参考

[1] https://www.cnblogs.com/wuchanming/p/4020463.html
[2] 《unix网络编程》第5.9章节

<think>我们正在处理用户关于Linux/Unix系统中僵尸进程处理的问题。根据引用[3]:僵尸进程是已经结束运行但仍在进程表中存在的进程,因为父进程没有调用wait/waitpid来收集其退出状态。引用[2]提供了一些命令来查看和定位僵尸进程,如:ps-aux|grepZ#查看僵尸进程ps-A-ostat,ppid,pid,cmd|grep-e'^[Zz]'#定位僵尸进程引用[1]强调了僵尸进程的影响和预防的重要性。解决僵尸进程的方法主要有两种:1.让父进程调用wait/waitpid来回收子进程。这需要修改父进程的代码。2.如果父进程不会处理,可以杀死父进程(这样僵尸进程就会变成孤儿进程并被init进程回收)。但要注意,杀死父进程可能会影响服务。另外,如果僵尸进程已经产生,且其父进程是某个重要进程(如init),那么通常不需要担心,因为init会定期调用wait来清理。但如果父进程是我们自己的程序,那么我们需要修改程序。步骤:1.首先,使用命令(如上面提到的)来确认系统中是否存在僵尸进程。2.然后,根据情况处理:-如果是用户进程,可以尝试重启该父进程(先杀死父进程,再启动)。但要注意业务连续性。-修改父进程代码,添加信号处理函数(SIGCHLD)并在其中调用wait/waitpid。代码示例(C语言):#include<sys/types.h>#include<sys/wait.h>#include<signal.h>voidsigchld_handler(intsigno){while(waitpid(-1,NULL,WNOHANG)>0);//非阻塞地等待所有子进程}intmain(){signal(SIGCHLD,sigchld_handler);//...主程序逻辑}3.如果僵尸进程的父进程是init(pid=1),那么通常init会处理,但如果有大量僵尸进程,可能需要重启系统(极端情况)。注意:直接杀死僵尸进程是不可能的,因为它们已经死了。只能通过杀死父进程或让父进程回收。相关问题:1.什么是僵尸进程?它是如何产生的?2.如何检测系统中的僵尸进程?3.除了修改父进程代码,还有哪些方法可以避免僵尸进程?4.孤儿进程和僵尸进程有什么区别?5.在编写多进程程序时,如何避免僵尸进程?</think>### 如何在 Linux/Unix 系统中处理僵尸进程 #### 1. **理解僵尸进程** 僵尸进程是已终止但仍占据进程表条目的进程,因父进程未调用 `wait()`/`waitpid()` 回收其退出状态而产生[^3]。特征为状态 `Z`(Zombie),不消耗 CPU/内存,但占用有限的进程 ID 资源。 #### 2. **检测僵尸进程** - **查看所有僵尸进程**: ```bash ps aux | grep 'Z' # 或精确匹配状态码 ps -A -ostat,ppid,pid,cmd | grep -e '^[Zz]' ``` - **统计数量**: ```bash ps -aux | grep Z | wc -l ``` #### 3. **解决方案** ##### (1) 终止父进程(推荐) 僵尸进程会随父进程终止而被 init 进程(PID 1)自动回收: ```bash # 找到父进程 PID ps -o ppid= -p <僵尸进程PID> # 终止父进程(SIGTERM 或 SIGKILL) kill -15 <父进程PID> # 优雅终止 kill -9 <父进程PID> # 强制终止 ``` > **注意**:若父进程是关键服务(如引用[4]的 Python 服务),需重启服务。 ##### (2) 修改父进程代码 在父进程中添加信号处理逻辑,捕获子进程退出信号: ```c #include <signal.h> #include <sys/wait.h> void sigchld_handler(int sig) { while (waitpid(-1, NULL, WNOHANG) > 0); // 非阻塞回收所有子进程 } int main() { signal(SIGCHLD, sigchld_handler); // 注册 SIGCHLD 处理器 // ... 主程序逻辑 } ``` 此方法通过自动回收子进程避免僵尸产生[^1]。 ##### (3) 特殊工具 - 使用 `reap` 工具自动回收僵尸进程(需安装): ```bash reap -d 10 # 每 10 秒清理一次 ``` #### 4. **预防措施** - **编程规范**: - 父进程必须调用 `wait()` 系列函数。 - 对 `SIGCHLD` 使用 `SA_NOCLDWAIT` 标志(Linux 特有): ```c struct sigaction sa = {0}; sa.sa_flags = SA_NOCLDWAIT; sigaction(SIGCHLD, &sa, NULL); ``` - **系统监控**: 定期检查进程状态,如通过 Cron 任务运行检测命令。 > **关键点**:僵尸进程无法直接通过 `kill` 清除[^2],必须通过父进程或系统 init 回收。长期解决方案是修复父进程代码逻辑[^3]。 --- ### 相关问题 1. **僵尸进程与孤儿进程有何区别?** (孤儿进程由 init 接管,不会变僵尸;僵尸进程是父进程未回收的终止进程) 2. **哪些场景容易导致僵尸进程?** (如父进程忽略 SIGCHLD、未实现 wait 逻辑的多进程服务器) 3. **如何监控系统中的僵尸进程数量?** (结合 `ps`、`grep` 和定时任务实现自动化监控) 4. **在容器化环境(如 Docker)中处理僵尸进程有何特殊之处?** (容器 PID 命名空间隔离对僵尸进程回收的影响) 5. **为何僵尸进程不消耗资源却仍需处理?** (进程表条目有限,过量僵尸进程可能导致新进程创建失败) --- ### 引用来源 [^1]: 僵尸进程的总体影响及预防方法总结 [^2]: 僵尸进程检测与终止命令实践 [^3]: Linux 僵尸进程的产生机制与资源管理 [^4]: 僵尸进程的父进程示例(Python 服务)
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值