函数定义
#include <unistd.h>
pid_t fork(void);
pid_t vfork(void);
fork
作用:产生一个子进程。
返回:有两次,分别给父进程和子进程。子进程的返回值是0,父进程的返回值是子进程的进程ID。
给父进程返回子进程ID理由:Linux没有函数可以获取所有子进程的ID(需要及时返回)
给子进程返回0理由:进程只有一个父进程,可通过getppid() 获得父进程ID(不需要及时返回)
(ps. 进程ID 0 由内核交换进程使用)
返回后,子进程与父进程执行fork后的代码。
fork 与进程地址空间
子进程与父进程只共享代码段,其他部分如 数据段、堆、栈 互相独立。
因为大多数fork 后会执行exec,所以现在一般不会fork 时立即拷贝父进程的数据、堆、栈的副本,而是用 写时复制
写时复制(copy-on-write,COW)
父子进程在 fork 后,仍然共享数据、堆、栈空间。此时内核将这些空间的权限设置为“只读”。若任意一方修改了这些区域(产生了不一致),那么内核只给修改的区域对应的内存生成一个副本,通常是一个“页”。
文件共享
fork 会将父进程打开的文件描述符都复制到子进程中。父进程和子进程共享同一文件偏移量。
这种情况下,如果父子进程之间没有任何同步措施,那么可能对一个文件描述符的操作(例如写)会相互混合
所以fork 之后对文件描述符的处理一般采用以下方法:
1、父进程等待子进程结束,这样子进程退出后,文件描述符的偏移量已经更新,父进程后续操作安全。
2、父子进程fork 之后执行不同代码段,这样fork 之后,父子进程分别关闭各自不需要的文件描述符,这样不会互相干扰,这在网络服务进程中常用。
vfork
返回值和fork 相同,但是设计目的不同,vfork 被设计为子进程产生后立刻调用exec 或者exit,所以不会复制父进程的地址空间(exec 会修改代码段,而复制就多余了)。
子进程调用exec或exit 前,在父进程空间中运行。
fork 是写时复制,而vfork 不会复制。
子进程若没有立即执行exec或exit,而是修改数据、函数调用、或直接返回,都会带来未知结果;(貌似是coredump)
vfork 保证子进程先运行,调用exit 或exec 后父进程才有机会运行。
测试代码
#include <sys/types.h>
#include <fcntl.h>
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
int main()
{
int num = 0;
printf("fork now\n");
int fd = open("forktest.txt", O_RDWR | O_CREAT, 0600);
//pid_t pid = fork();
pid_t pid = vfork();
if (pid < 0)
{
printf("fork fail\n");
exit(-1);
}
if (pid == 0)
{
num = 1;
char* buf = "this is son process.";
write(fd, buf, strlen(buf));
}
else
{
//num = 2;
char* buf = "this is father process.";
write(fd, buf, strlen(buf));
}
printf("num is:%d\n", num);
close(fd);
exit(0);
}
fork的输出:
$ ./forktest
fork now
num is:0
$ num is:1
父进程结束后,先显示了命令行提示符,然后才是子进程的输出。
vfork 的输出:
fork now
num is:1
num is:1
子进程在父进程地址空间运行,所以num 是一样的,且子进程先输出了。
至于fork 有可能因为父子进程同时写文件而错乱,貌似没有遇到。
《Unix环境高级编程》8.3-8.4 小节
Linux中fork,vfork和clone详解(区别与联系)
fork与vfork的区别 用代码清晰讲解了fork 与vfork 对代码段和数据段的拷贝情况