言归正传,这其实自己脑子灵光一现的问题,当然这个“返回两次”需要打引号。读文章的你觉得能回答这个问题?如果能:说明对进程的理解比较深刻的。如果不能,我们接着往下看文章吧。
下面展示的是典型的使用方法:
#include<unistd.h>
#include<stdio.h>
#include<stdlib.h>
int main(int argc,char *argv[]){
pid_t pid=fork();
if ( pid < 0 ) {
fprintf(stderr,"错误!");
} else if( pid == 0 ) {
printf("子进程空间");
exit(0);
} else {
printf("父进程空间,子进程pid为%d",pid);
}
// 可以使用wait或waitpid函数等待子进程的结束并获取结束状态
exit(0);
}
注意!样例代码仅供参考,样例代码存在着父进程在子进程结束前结束的可能性。必要的时候可以使用wait或 waitpid函数让父进程等待子进程的结束并获取子进程的返回状态。
所以所谓的“返回两次”的意思就是在父子进程中fork都会返回,而且返回值不一样。要想回答这个问题,必须要从fork的实现原理上入手。
fork两次返回的唯一区别子进程返回的是0,而父进程的返回值为新产生的子进程的进程ID。
其实fork()系统调用的实现在Linux中是通过clone()实现的,其中clone()的flags参数指定为SIGCHID信号及所有清零的clone标志。而他的child_stack参数是父进程当前的堆栈指针。so,父进程和子进程暂时共享同一个用户态堆栈。但是由于写时拷贝机制的存在,通常只有父子进程中有一个尝试去改变堆栈数据,则立即各自得到堆栈数据的拷贝。
哪些是继承父进程,哪些是子进程独有的。
子进程继承父进程
用户号UIDs和用户组号GIDs
环境Environment
堆栈
共享内存
打开文件的描述符
执行时关闭(Close-on-exec)标志
信号(Signal)控制设定
进程组号
当前工作目录
根目录
文件方式创建屏蔽字
资源限制
控制终端
子进程独有
进程号PID
不同的父进程号
自己的文件描述符和目录流的拷贝
子进程不继承父进程的进程正文(text),数据和其他锁定内存(memory locks)
不继承异步输入和输出
有了上面的基础,我们再来仔细分析一下。内核创建一个新的进程(子进程),并且在进程表中相应为它建立一个新的表项。新进程和原有进程的可执行程序是同一个程序;上下文和数据,绝大部分就是原进程(父进程)的拷贝,但它们是两个相互独立的进程!此时程序寄存器pc,在父、子进程的上下文中都声称,这个进程目前执行到fork调用即将返回(此时子进程不占有CPU,子进程的pc不是真正保存在寄存器中,而是作为进程上下文保存在进程表中的对应表项内)。问题是怎么返回,在父子进程中就分道扬镳。
父进程继续执行,内核对fork的实现,使这个调用在父进程中返回刚刚创建的子进程的pid(一个正整数),所以在父进程返回时,是大于0的数。
子进程在之后的某个时候得到调度(这句话是不正确的,父子进程的调度顺序函数没有任何承诺,无法保证谁先执行),它的上下文被换入,占据 CPU,操作系统对fork的实现,因为子进程没有子进程,使得子进程中fork调用返回0。所以在这个进程(注意这不是父进程了哦,虽然是同一个程序,但是这是同一个程序的另外一次执行,在操作系统中这次执行是由另外一个进程表示的,从执行的角度说和父进程相互独立)中pid=0。so,返回的时候是0了。