Linux vfork简介

本文详细解析了vfork与fork的区别及其应用场景,包括vfork如何通过共享内存来提高效率,为何不能在子进程中使用return,以及如何正确地使用vfork避免coredump。此外,还介绍了fork的一种优化方式——写时拷贝技术。

(一)vfork和fork的区别

fork 是创建一个子进程,并把父进程的内存数据copy到子进程中。
vfork 是创建一个子进程,并和父进程的内存数据share一起用。

为什么有vfork,因为大多数fork的子进程就直接exec或者exit那么再copy一份内存数据就显得没必要了。
在子进程调用exec和exit之前,都在父进程的空间中运行。

所以,BSD搞出了个父子进程共享的 vfork,这样成本比较低。因此,vfork本就是为了exec而生。

另外vfork跟fork还有一个区别就是:vfork保证子进程先运行,在它调用exec或者exit之后父进程才被调度,当子进程调用这两个函数中的任意一个时,父进程会恢复运行。

(二)vfork与core dump

详情见vfork挂掉的一个问题

代码见:https://github.com/NearXdu/APUE

在子进程中使用return就会挂掉:

//bad_vfork.c
#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>

int glob = 6;
int
main(void)
{
    int var;
    pid_t pid;
    var = 88;
    printf("before vfork\n");
    if ((pid = vfork()) < 0) {
    printf("vfork error");
    exit(-1);
    } else if (pid == 0) 
    {
    /* 子进程 */
    glob++;
    var++;
    return 0;
    }
    printf("pid=%d, glob=%d, var=%d\n", getpid(), glob, var);
    return 0;
}

从上面我们知道,结束子进程的调用是exit()而不是return,如果你在vfork中return了,那么,这就意味main()函数return了,
注意因为函数栈父子进程共享,所以整个程序的栈就跪了。

如果你在子进程中return,那么基本是下面的过程:

1)子进程的main() 函数 return了,于是程序的函数栈发生了变化。

2)而main()函数return后,通常会调用 exit()或相似的函数(如:_exit(),exitgroup())

3)这时,父进程收到子进程exit(),开始从vfork返回,但是尼玛,老子的栈都被你子进程给return干废掉了,你让我怎么执行?(注:栈会返回一个诡异一个栈地址,对于某些内核版本的实现,直接报“栈错误”就给跪了,然而,对于某些内核版本的实现,于是有可能会再次调用main(),于是进入了一个无限循环的结果,直到vfork 调用返回 error

好了,现在再回到 return 和 exit,return会释放局部变量,并弹栈,回到上级函数执行。

exit直接退掉。如果你用c++ 你就知道,return会调用局部对象的析构函数,exit不会。(注:exit不是系统调用,是glibc对系统调用_exit()_exitgroup()的封装)

可见,子进程调用exit() 没有修改函数栈,所以,父进程得以顺利执行。

但是!注意!如果你调用 exit() 函数,还是会有问题的,正确的方法应该是调用 _exit() 函数,因为 exit() 函数 会 flush 并 close 所有的 标准 I/O

这样会导致父进程受到影响。

正确的代码:

#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>

int glob = 6;

    int
main(void)
{
    int var;
    pid_t pid;
    var = 88;
    printf("before vfork\n");
    if ((pid = vfork()) < 0) {
    printf("vfork error");
    exit(-1);
    } else if (pid == 0) {
    /* 子进程 */
    glob++;
    var++;
    _exit(0);
    }
    printf("pid=%d, glob=%d, var=%d\n", getpid(), glob, var);
    return 0;
}

也不需要在父进程中sleep,因为vfork保证了直到执行exec或者exit,父进程都处于休眠状态。

(三)fork的优化

很明显,fork太重,而vfork又太危险,所以,就有人开始优化fork这个系统调用。优化的技术用到了著名的写时拷贝(COW)。

也就是说,对于fork后并不是马上拷贝内存,而是只有你在需要改变的时候,才会从父进程中拷贝到子进程中,这样fork后立马执行exec的成本就非常小了。

(四)参考

  1. APUE
  2. http://coolshell.cn/articles/12103.html
<think> 我们正在讨论Linux中的`vfork()`函数。根据引用内容,`vfork()`与`fork()`的主要区别在于: 1. `vfork()`创建的子进程与父进程共享地址空间,而不是复制父进程的地址空间(像`fork()`那样)。 2. `vfork()`保证子进程先运行,直到子进程调用`exec`或`exit`之后,父进程才能被调度运行。 3. 在子进程调用`exec`或`exit`之前,子进程在父进程的地址空间中运行,因此修改数据会影响父进程(这可能导致问题,如死锁)。 另外,引用[2]中的代码示例展示了`vfork()`的用法:子进程修改了变量`cnt`,由于共享地址空间,父进程中的`cnt`也会被修改。子进程在`cnt==3`时调用`exit(0)`退出,然后父进程才开始运行。 引用[3]则展示了`fork()`与`wait()`的配合使用:父进程通过`wait(&status)`等待子进程结束,并获取子进程的退出状态。 因此,我们可以这样介绍`vfork()`: ### Linux vfork函数详解 `vfork()`是Linux中创建新进程的系统调用,与`fork()`类似,但存在关键差异: #### 1. **核心机制:共享地址空间** - ✅ **不复制父进程内存**: `vfork()`创建的子进程**直接共享父进程的地址空间**,而非创建副本[^1][^2]。 - ⚠️ **数据修改风险**: 子进程对变量的修改(如`cnt++`)会直接影响父进程的同一变量[^2]。 #### 2. **执行顺序保证** - ⏱️ **子进程优先执行**: 内核保证子进程在父进程之前运行,直到子进程调用以下函数之一: - `exec()`:加载新程序,替换地址空间 - `exit()`:退出进程并释放资源 - 🚫 **父进程阻塞**: 子进程未调用`exec()`或`exit()`时,父进程**被挂起**(sleep/wait类函数可能引发死锁)[^1]。 #### 3. **典型应用场景** - 🔄 **`exec()`前优化**: 若子进程**立即调用`exec()`**,`vfork()`因避免内存复制而比`fork()`高效[^1]。 - ⛔ **非`exec()`场景禁用**: 若子进程不调用`exec()`,使用`vfork()`可能导致父进程数据污染或死锁。 #### 4. **代码示例分析(引用[2])** ```c #include <stdio.h> #include <sys/types.h> #include <unistd.h> #include <stdlib.h> int main() { pid_t pid; int cnt = 0; // 父子进程共享变量 pid = vfork(); // 创建子进程 if (pid > 0) { // 父进程 while(1) { printf("father: cnt=%d\n", cnt); // 受子进程修改影响 sleep(1); } } else if (pid == 0) { // 子进程 while(1) { cnt++; // 修改共享变量 if (cnt == 3) { exit(0); // 子进程退出,父进程恢复运行 } sleep(1); } } return 0; } ``` **执行结果**: ``` father: cnt=1 // 子进程修改后父进程输出 father: cnt=2 father: cnt=3 // 子进程退出,父进程继续循环输出cnt=3 ``` #### 5. **安全使用规范** | 操作 | 是否允许 | 风险说明 | |--------------------|--------------------------|-----------------------------| | **修改全局变量** | ❌ 禁止 | 直接破坏父进程状态 | | **调用`exec()`** | ✅ 推荐 | 唯一安全且高效的做法 | | **调用`exit()`** | ✅ 退出时必须 | 避免父进程永久阻塞 | | **调用其他函数** | ⚠️ 部分禁用(如`printf`) | 可能因内部锁导致死锁[^1] | #### 6. **现代替代方案** - 🚀 **写时复制(Copy-On-Write)优化**: 现代`fork()`已通过COW技术避免立即复制内存,大幅降低了`vfork()`的性能优势。 - 📉 **`vfork()`的弃用趋势**: POSIX.1-2008标准移除了`vfork()`规范,建议优先使用`fork()`+`exec()`组合[^1]。 > 📌 **结论**:除非在**极致性能优化**且**确保立即调用`exec()`**的场景下,否则应避免使用`vfork()`。多数情况下,安全的`fork()`是更优选择。 §§相关问题§§ 1. `vfork()`与`fork()`在内存复制上的具体性能差异如何量化? 2. 为什么`vfork()`后子进程调用`printf()`可能导致死锁? 3. 如何通过`wait()`系统调用正确回收`vfork()`创建的子进程? 4. 现代Linux内核中`fork()`的COW实现机制是怎样的? [^1]: linux c之创建进程fork和vfork函数之间的区别。vfork()创建的进程并不将父进程的地址空间完全复制到子进程中,因为子进程会立即调用exec (或exit)于是也就不会存放该地址空间。相反,在子进程调用exec或exit之前,它在父进程的空间进行。 [^2]: linuxvfork函数。vfork保证子进程先进行运行,当子进程调用exit退出后,父进程才执行。在子进程中修改的变量cnt会影响父进程。 [^3]: Linux--vfork函数。通过wait(&status)可以等待子进程结束并获取退出状态。 </think> ### Linux vfork函数详解 `vfork()`是Linux中创建新进程的系统调用,与`fork()`类似但存在关键差异: #### 1. **核心机制:共享地址空间** - ✅ **不复制父进程内存**: `vfork()`创建的子进程**直接共享父进程的地址空间**,而非创建副本[^1][^2]。 - ⚠️ **数据修改风险**: 子进程对变量的修改(如`cnt++`)会直接影响父进程的同一变量[^2]。 #### 2. **执行顺序保证** - ⏱️ **子进程优先执行**: 内核保证子进程在父进程之前运行,直到子进程调用以下函数之一: - `exec()`:加载新程序,替换地址空间 - `exit()`:退出进程并释放资源 - 🚫 **父进程阻塞**: 子进程未调用`exec()`或`exit()`时,父进程**被挂起**(sleep/wait类函数可能引发死锁)[^1]。 #### 3. **典型应用场景** - 🔄 **`exec()`前优化**: 若子进程**立即调用`exec()`**,`vfork()`因避免内存复制而比`fork()`高效[^1]。 - ⛔ **非`exec()`场景禁用**: 若子进程不调用`exec()`,使用`vfork()`可能导致父进程数据污染或死锁。 #### 4. **代码示例分析(引用[2])** ```c #include <stdio.h> #include <sys/types.h> #include <unistd.h> #include <stdlib.h> int main() { pid_t pid; int cnt = 0; // 父子进程共享变量 pid = vfork(); // 创建子进程 if (pid > 0) { // 父进程 while(1) { printf("father: cnt=%d\n", cnt); // 受子进程修改影响 sleep(1); } } else if (pid == 0) { // 子进程 while(1) { cnt++; // 修改共享变量 if (cnt == 3) { exit(0); // 子进程退出,父进程恢复运行 } sleep(1); } } return 0; } ``` **执行结果**: ``` father: cnt=1 // 子进程修改后父进程输出 father: cnt=2 father: cnt=3 // 子进程退出,父进程继续循环输出cnt=3 ``` #### 5. **安全使用规范** | 操作 | 是否允许 | 风险说明 | |--------------------|--------------------------|-----------------------------| | **修改全局变量** | ❌ 禁止 | 直接破坏父进程状态 | | **调用`exec()`** | ✅ 推荐 | 唯一安全且高效的做法 | | **调用`exit()`** | ✅ 退出时必须 | 避免父进程永久阻塞 | | **调用其他函数** | ⚠️ 部分禁用(如`printf`) | 可能因内部锁导致死锁[^1] | #### 6. **现代替代方案** - 🚀 **写时复制(Copy-On-Write)优化**: 现代`fork()`已通过COW技术避免立即复制内存,大幅降低了`vfork()`的性能优势。 - 📉 **`vfork()`的弃用趋势**: POSIX.1-2008标准移除了`vfork()`规范,建议优先使用`fork()`+`exec()`组合[^1]。 > 📌 **结论**:除非在**极致性能优化**且**确保立即调用`exec()`**的场景下,否则应避免使用`vfork()`。多数情况下,安全的`fork()`是更优选择。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值