linux复习篇(六)--fork()之写时拷贝

本文深入探讨了Linux系统中的fork()函数及其采用的写时拷贝技术。通过阐述逻辑地址与物理地址的区别,解释了fork()如何复制父进程的虚拟地址空间并共享物理地址,只有在写操作时才会为子进程创建新的物理页。同时,介绍了vfork()的特性以及fork()在创建进程时的开销,包括复制页表和创建进程描述符。在fork()后调用exec()的情况中,优化策略避免了不必要的数据复制。最后,总结了父子进程在文件描述符和内存空间上的共享与独立情况。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

首先,这篇博客要解决的几个问题:

1.什么是写时拷贝技术?

2.fork()在复制进程的时候,共享哪些东西?拷贝了哪些东西?

先引入两个概念:

逻辑地址(进程地址空间): cpu所生成的地址。cpu产生的逻辑地址分为:p(页号)它包含在每个页在物理内存中的基址,用来做页表的索引;d(页偏移),同基址相结合,用来确定送入内存设备的物理内存地址。

物理地址:内存单元所看到的地址。
用户程序看不到物理地址。用户只生成逻辑地址。逻辑地址与物理地址呈现一一映射的关系。
 

写时拷贝

简单来说,fork()只会复制父进程的虚拟地址空间,共享父进程的物理地址,只要发生写操作的时候(因为共享的页会标记为只读,尝试写的时候会引发缺页异常,才会调用相应的函数为子进程开辟自己该段的物理页),才会为子进程开辟新的物理页

注:(vfork()连虚拟地址内核都不分配,全部共享父进程的。)

   传统的fork()系统调用直接把所有的资源复制给新创建的进程。这种实现过于简单并且效率低下,因为它拷贝的数据也许并不共享,更糟的情况是,如果新进程打算立即执行一个新的映像,那么所有的拷贝都将前功尽弃。Linux 的fork(使用写时拷贝(copy-on-write) 页实现。

写时拷贝是-种可以推迟甚至免除拷贝数据的技术。内核此时并不复制整个进程地址空间,而是让父进程和子进程共享同-一个拷贝。  只有在需要写人的时候,数据才会被复制,从而使各个进程拥有各自的拷贝。也就是说,资源的复制只有在需要写人的时候才进行,在此之前,只是以只读方式共享。这种技术使地址空间上的页的拷贝被推迟到实际发生写入的时候才进行。在页根本不会被写入的情况下(举例来说,fork()后立即调用exec()它们就无须复制了。

      fork()的实际开销就是复制父进程

### 写时拷贝机制的原理 写时拷贝(Copy-On-Write, COW)是一种用于优化资源分配和减少冗余的操作系统技术。在 `fork()` 调用过程中,当一个进程通过 `fork()` 创建子进程,操作系统并不会立即将父进程的所有内存页复制给子进程[^1]。相反,父子进程会共享相同的物理页面,这些页面最初是以只读模式访问的。 #### 地址空间共享 `fork()` 调用后,子进程继承了父进程的虚拟地址空间,这意味着两者具有完全一致的内存布局。然而,这并不意味着所有内存都被实际复制。实际上,操作系统仅复制必要的元数据结构(如页表),而具体的内存内容则由父子进程共同使用[^3]。 #### 数据修改触发复制 只有当某个进程尝试对共享页面进行写操作,操作系统才会检测到这一行为并执行以下动作: 1. **分离页面**:将要被写的页面从共享状态转换为私有状态。 2. **复制页面**:为当前进程创建该页面的一个独立副本。 3. **更新页表**:调整页表条目,使得后续对该页面的访问指向新的副本而不是原始页面[^2]。 这种方法显著降低了因不必要的数据复制带来的性能损耗,尤其是在许多场景下子进程很快就会调用 `exec()` 来加载全新的程序逻辑,从而放弃原有的大部分内存内容的情况下[^1]。 #### 实现细节 具体而言,现代 Linux 系统中的 `fork()` 实现有赖于 MMU (Memory Management Unit) 支持以及分页机制配合完成上述过程。每当发生越权存取事件——即试图向标记为 “只读”的区域写入数据,会产生缺页异常(Page Fault),进而激活内核层面处理流程来实施真正的拷贝工作流[^3]。 以下是简化版伪代码展示如何模拟此机制: ```c void *cow_fork(void *parent_page){ void *child_page = map_shared(parent_page); // 映射成共享只读 on_write_attempt(child_page){ // 注册回调监听写企图 child_page = copy_private(parent_page); // 执行深拷贝至独占区 mark_writable(child_page); // 修改权限允许写入 } return child_page; } ``` ### 结论 综上所述,借助写时拷贝机制,`fork()` 可以高效地生成新进程实例,极大地节约了计算资源消耗,并提升了整体系统的响应速度与吞吐量。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值