fork

前两天有人问了个关于Unix的fork()系统调用的面试题,这个题正好是我大约十年前找工作时某公司问我的一个题,我觉得比较有趣,写篇文章与大家分享一下。这个题是这样的:

题目:请问下面的程序一共输出多少个“-”?

1
2
3
4
5
6
7
8
9
10
11
12
13
14
#include <stdio.h>
#include <sys/types.h>
#include <unistd.h>
 
int main( void )
{
    int i;
    for (i=0; i<2; i++){
       fork();
       printf ( "-" );
    }
 
    return 0;
}

如果你对fork()的机制比较熟悉的话,这个题并不难,输出应该是6个“-”,但是,实际上这个程序会很tricky地输出8个“-”。

要讲清这个题,我们首先需要知道fork()系统调用的特性,

  • fork()系统调用是Unix下以自身进程创建子进程的系统调用,一次调用,两次返回,如果返回是0,则是子进程,如果返回值>0,则是父进程(返回值是子进程的pid),这是众为周知的。
  • 还有一个很重要的东西是,在fork()的调用处,整个父进程空间会原模原样地复制到子进程中,包括指令,变量值,程序调用栈,环境变量,缓冲区,等等。

所以,上面的那个程序为什么会输入8个“-”,这是因为printf(“-”);语句有buffer,所以,对于上述程序,printf(“-”);把“-”放到了缓存中,并没有真正的输出(参看《C语言的迷题》中的第一题),在fork的时候,缓存被复制到了子进程空间,所以,就多了两个,就成了8个,而不是6个。

另外,多说一下,我们知道,Unix下的设备有“块设备”和“字符设备”的概念,所谓块设备,就是以一块一块的数据存取的设备,字符设备是一次存取一个字符的设备。磁盘、内存都是块设备,字符设备如键盘和串口。块设备一般都有缓存,而字符设备一般都没有缓存

对于上面的问题,我们如果修改一下上面的printf的那条语句为:

1
printf ( "-\n" );

或是

1
2
printf ( "-" );
fflush (stdout);

就没有问题了(就是6个“-”了),因为程序遇到“\n”,或是EOF,或是缓中区满,或是文件描述符关闭,或是主动flush,或是程序退出,就会把数据刷出缓冲区。需要注意的是,标准输出是行缓冲,所以遇到“\n”的时候会刷出缓冲区,但对于磁盘这个块设备来说,“\n”并不会引起缓冲区刷出的动作,那是全缓冲,你可以使用setvbuf来设置缓冲区大小,或是用fflush刷缓存。

我估计有些朋友可能对于fork()还不是很了解,那么我们把上面的程序改成下面这样:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
#include <stdio.h>
#include <sys/types.h>
#include <unistd.h>
int main( void )
{
    int i;
    for (i=0; i<2; i++){
       fork();
       //注意:下面的printf有“\n”
       printf ( "ppid=%d, pid=%d, i=%d \n" , getppid(), getpid(), i);
    }
    sleep(10); //让进程停留十秒,这样我们可以用pstree查看一下进程树
    return 0;
}

于是,上面这段程序会输出下面的结果,(注:编译出的可执行的程序名为fork)

1
2
3
4
5
6
7
8
9
10
ppid=8858, pid=8518, i=0
ppid=8858, pid=8518, i=1
ppid=8518, pid=8519, i=0
ppid=8518, pid=8519, i=1
ppid=8518, pid=8520, i=1
ppid=8519, pid=8521, i=1
 
$ pstree -p | grep fork
|- bash (8858)-+-fork(8518)-+-fork(8519)---fork(8521)
|            |            `-fork(8520)

面对这样的图你可能还是看不懂,没事,我好事做到底,画个图给你看看:

注意:上图中的我用了几个色彩,相同颜色的是同一个进程。于是,我们的pstree的图示就可以成为下面这个样子:(下图中的颜色与上图对应)

这样,对于printf(“-”);这个语句,我们就可以很清楚的知道,哪个子进程复制了父进程标准输出缓中区里的的内容,而导致了多次输出了。(如下图所示,就是我阴影并双边框了那两个子进程)

感觉以上配图清晰但是容易让人产生误解,还是直接画树

http://coolshell.cn/articles/7965.html




05-16
### Fork 的概念及其在编程和版本控制中的应用 #### 编程中的 Fork `fork()` 是 Unix 和类 Unix 操作系统中用于创建新进程的一个重要函数。调用 `fork()` 函数时,当前进程会复制自己并生成一个新的子进程[^1]。这个过程可以被描述为:父进程通过调用 `fork()` 创建了一个几乎完全相同的副本——即子进程。父子进程之间的主要区别在于它们的 PID(Process ID),以及返回值的不同。 - **返回值** - 对于父进程而言,`fork()` 返回的是子进程的 PID。 - 子进程中,`fork()` 则返回 0。 - 如果发生错误,则返回 `-1` 表示失败。 下面是一个简单的 C 代码示例展示如何使用 `fork()`: ```c #include <stdio.h> #include <unistd.h> int main() { pid_t pid = fork(); // 调用 fork() if (pid == 0) { printf("Child Process: My PID is %d\n", getpid()); } else if (pid > 0){ printf("Parent Process: Child's PID is %d\n", pid); } else { perror("Fork failed"); } return 0; } ``` 此程序展示了基本的父子进程关系,并打印各自的 PID 值来区分两者。 需要注意的是,在某些硬件环境下实现高效内存分配存在困难的情况下,标准 POSIX 定义还提供了像 `vfork()` 这样的替代方案作为补充选项之一[^3]。 #### 版本控制系统中的 Fork 另一方面,“fork”一词也广泛应用于软件开发领域特别是基于 Git 或其他分布式版本控制系统的工作流程里。“Forking repository”指的是开发者从原始仓库派生出自己的独立分支来进行修改或者实验而不影响原项目[^2]。这种做法常见于开源协作模式下当个人希望提交补丁给上游维护者之前先在一个分离的空间完成初步工作后再发起 pull request 请求合并更改到官方主线之中去。 例如,在 GitHub 平台上执行如下操作即可轻松获得一份属于您自己的远程拷贝以便自由编辑而无需担心破坏源码库结构: 1. 访问目标存储库页面; 2. 单击右上方 “Fork” 按钮; 3. 自动跳转至您的账户下的克隆版地址链接处; 之后就可以按照常规方式 clone 下载下来本地继续后续处理步骤啦! 总结起来看,无论是操作系统层面还是现代互联网服务架构设计思路当中都离不开对资源隔离机制的研究探讨,而这其中就包含了我们今天所提到这两个不同维度却同样重要的技术知识点:“fork”。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值