计算机原理-为什么fork会返回两次？

最新推荐文章于 2023-10-19 09:23:50 发布

转载最新推荐文章于 2023-10-19 09:23:50 发布 · 1k 阅读

计算机原理专栏收录该内容

43 篇文章

订阅专栏

本文详细解析了Linux系统中fork()函数的工作原理，揭示了为什么fork()会在父进程和子进程中分别返回，且返回值不同。通过代码示例和内部机制的讲解，帮助读者深入了解进程创建的过程。

言归正传，这其实自己脑子灵光一现的问题，当然这个“返回两次”需要打引号。读文章的你觉得能回答这个问题？如果能：说明对进程的理解比较深刻的。如果不能，我们接着往下看文章吧。

下面展示的是典型的使用方法：

#include<unistd.h>#include<stdio.h>#include<stdlib.h> int main(int argc,char *argv[]){    pid_t pid=fork();    if ( pid < 0 ) {        fprintf(stderr,"错误！");    } else if( pid == 0 ) {        printf("子进程空间");        exit(0);    } else {        printf("父进程空间，子进程pid为%d",pid);    }    // 可以使用wait或waitpid函数等待子进程的结束并获取结束状态    exit(0);}

注意！样例代码仅供参考，样例代码存在着父进程在子进程结束前结束的可能性。必要的时候可以使用wait或 waitpid函数让父进程等待子进程的结束并获取子进程的返回状态。

所以所谓的“返回两次”的意思就是在父子进程中fork都会返回，而且返回值不一样。要想回答这个问题，必须要从fork的实现原理上入手。

fork两次返回的唯一区别子进程返回的是0，而父进程的返回值为新产生的子进程的进程ID。

其实fork（）系统调用的实现在Linux中是通过clone（）实现的，其中clone（）的flags参数指定为SIGCHID信号及所有清零的clone标志。而他的child_stack参数是父进程当前的堆栈指针。so，父进程和子进程暂时共享同一个用户态堆栈。但是由于写时拷贝机制的存在，通常只有父子进程中有一个尝试去改变堆栈数据，则立即各自得到堆栈数据的拷贝。

哪些是继承父进程，哪些是子进程独有的。

子进程继承父进程

用户号UIDs和用户组号GIDs 环境Environment 堆栈 共享内存 打开文件的描述符 执行时关闭（Close-on-exec）标志 信号（Signal）控制设定 进程组号 当前工作目录 根目录 文件方式创建屏蔽字 资源限制 控制终端

子进程独有

进程号PID 不同的父进程号 自己的文件描述符和目录流的拷贝 子进程不继承父进程的进程正文（text），数据和其他锁定内存（memory locks） 不继承异步输入和输出

有了上面的基础，我们再来仔细分析一下。内核创建一个新的进程（子进程），并且在进程表中相应为它建立一个新的表项。新进程和原有进程的可执行程序是同一个程序；上下文和数据，绝大部分就是原进程（父进程）的拷贝，但它们是两个相互独立的进程！此时程序寄存器pc，在父、子进程的上下文中都声称，这个进程目前执行到fork调用即将返回（此时子进程不占有CPU，子进程的pc不是真正保存在寄存器中，而是作为进程上下文保存在进程表中的对应表项内）。问题是怎么返回，在父子进程中就分道扬镳。

父进程继续执行，内核对fork的实现，使这个调用在父进程中返回刚刚创建的子进程的pid（一个正整数），所以在父进程返回时，是大于0的数。

子进程在之后的某个时候得到调度(这句话是不正确的，父子进程的调度顺序函数没有任何承诺，无法保证谁先执行)，它的上下文被换入，占据 CPU，操作系统对fork的实现，因为子进程没有子进程，使得子进程中fork调用返回0。所以在这个进程（注意这不是父进程了哦，虽然是同一个程序，但是这是同一个程序的另外一次执行，在操作系统中这次执行是由另外一个进程表示的，从执行的角度说和父进程相互独立）中pid=0。so，返回的时候是0了。