进程创建
进程创建,是指操作系统创建一个新的进程;UNIX系统用 fork() 系统调用,而 windows 系统用CreatProcess();我们先来探讨在什么情况下需要创建进程
-
系统初始化,创建内核启动的第一个用户级
init
进程 -
执行中的进程调用了fork()系统函数
-
用户登录,用户命令请求创建进程。例如:用户双击一个图标
-
一个批处理作业初始化。大型机、高性能计算机用户提交一个课题,则系统建立作业控制块,在作业调度后在系统内存中创建进程
主要讨论第二点,进程调用fork,当控制转移到内核中的fork代码后,内核做什么事?
- 系统会分配新的内存块和内核数据结构给子进程
- 将父进程的部分数据结构写时拷贝给子进程
- 系统添加子进程到系统进程列表中
- fork 返回,调用器开始调度
新的子进程会继承父进程的资源(堆栈,数据空间),操作系统会把父进程的虚拟地址空间拷贝一份给子进程作为地址空间,两个进程分别独立,虽然代码相同,但是却不共享,各自有一份数据.
写时拷贝:就像名字一样,子进程只有在写的时候才进行拷贝,如果子进程并不修改资源,那么就会一直共享父进程的资源,每个子进程只要保存指向这个资源的指针就行了,这样做可以提高效率,减少复制带来的开销
如果子进程要修改资源,父进程拷贝一份它的地址空间给子进程,让子进程在它的地址空间里面随意修改,这样就不会影响到父进程了
写时拷贝在内核中的实现
与内核页相关的数据会被标记为只读和写时拷贝,如果进程试图修改一个页,就会产生一个缺页中断,内核就会对该页进行复制,并且清除页面的只读属性,表示它不再被共享
写时拷贝是一种惰性算法,尽量推迟它们那些费时费力操作,直到必要的时刻采取操作,就是能 ‘拖多久就拖多久’ 的思想.
当进程调用 fork 完成后 ,会有两个返回值,子进程返回0,父进程返回子进程的 pid
,一般大于0,通过返回值判断进程是父进程还是子进程,另外也有两个函数getpid
,getppid
分别获取子进程 pid
和父进程 pid
,至于父进程和子进程的执行顺序是未知的,这是由调度器决定
问答题:一共创建了几个进程?
4个进程 ,8个返回值
问答题2:一共会输出几个 '='
#include <stdio.h>
#include <unistd.h>
int main(){
for(int i = 0;i<2;++i){
fork();
printf("=");
}
return 0;
}
答:8个,由于第一次创建的时候 ‘ = ’在缓冲区,所以在拷贝地址空间的时候也把缓冲区的内容复制给了第二个进程,接下来两个进程又分别创建一个进程,创建的进程都带有 ‘=’ ,然后四个进程分别往缓冲区里输入 ‘=’,最后刷新缓冲区;特别注意的就是:缓冲区也是内存,在进程创建的时候也会被拷贝到另一个进程中;
vfork 和 fork 区别
- fork 子进程拷贝父进程的代码段和数据段,但是 vfork 创建出来的子进程和父进程共享数据段;
- fork 父子进程执行次序不确定,但是 vfork 是子进程先运行,在调用 exec 或exit 之前与父进程数据是共享的,在它调用 exec 或 exit 之后父进程才被调度运行;
#include <stdio.h>
#include <unistd.h>
#include <sys/type.h>
#include <errno.h>
#include <stdlib.h>
主函数
打印结果是多少?
由于是 vfork 创建子进程,子进程与父进程共享地址空间;所以在父进程执行的时候 count 依然是 5;并不会从 1 开始;
在子进程调用 exec 或 exit 退出之后父进程才被调度运行, 否则子进程将依赖于父进程的运行,而父进程也依赖于子进程运行,就这样一直僵持下去形成了 死锁
参考文献
探讨 进程的创建和终止
探讨 fork 、 vfork 、 clone 的区别?