【后台开发】【线程 | 进程】进程_后端开发应用程序一个进程-优快云博客

本文链接：https://blog.youkuaiyun.com/qq_40431104/article/details/96267481

本文详细介绍了进程与线程的概念，强调进程是程序的运行实例，线程是CPU执行的最小单位。讨论了多进程和多线程的差异，并详细阐述了Linux系统中进程的创建和结束，包括fork()函数的使用、进程的写时复制概念以及exit()和_exit()函数在进程结束时的作用。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

进程与线程

进程是计算机中处于运行中程序的实体；每个进程都有独立的代码和数据空间，进程间的切换会有较大的开销。
线程是CPU执行的最小单元，进程是线程的容器；同一类线程共享代码和数据空间，每个线程有独立的运行栈和程序计数器（PC），线程切换开销小。

多进程与多线程

多进程是指操作系统能同时运行多个任务（程序）；
多线程是指在一个程序中有多个顺序流在执行。

程序与进程

进程结构

进程结构一般由3部分组成：代码段、数据段、堆栈段

代码段：用于存放程序代码的数据。假如机器中有多个进程运行相同的一个程序，那么他们就可以使用同一个代码段。
数据段：用于存放程序的全局变量、常量和静态变量。
堆栈段：堆栈段中的栈用于函数调用，存放函数参数、函数内部定义的局部变量。
堆栈段还包括了进程控制块（PCB）：PCB处于进程核心堆栈的底部，是进程存在的唯一标识，系统通过PCB对进程进行管理和调度。

程序的生成

Linux下C++程序的生成分为4个阶段：预编译、编译、汇编、链接。编译器g++经过预编译、编译、汇编3个步骤将源程序文件转换为目标文件。如果程序有多个目标文件或使用了库函数，编译器还需要将所有的目标文件或所需的库链接起来，最后形成可执行程序。

程序转换为进程

程序本身只是指令、数据以及组织形式的描述，进程才是程序真正的运行实例。即：所谓程序，不过是指可运行的二进制代码文件，把这种文件加载到内存中运行就得到了一个进程。

所谓的程序，指的是可运行的二进制代码文件，把这种文件加载到内存中运行就得到了一个进程。进程与进程标识符是一对一的关系，而与程序文件是多对一的关系（同一个程序文件可以被加载多次成为不同的进程）。

一般程序转换为进程分为以下几个步骤：

内核将程序读入内存，为程序分配内存空间。
内核为该进程分配进程标识符（PID）和其他所需资源。
内核为进程保存PID及相应的状态信息，把进程放到运行队列中等待执行，程序转化为进程后就可以被操作系统的调度程序调度执行了。

进程的创建与结束

进程的创建有两种方式：一种是由操作系统创建，一种是由父进程创建。在Linux系统中，除了系统启动之后的第一个进程由系统来创建，其余进程由已存在的进程创建，形成一个树形结构。

树根是由系统自动构造的，即在内核态下执行的0号进程，它是所有进程的祖先。
由0号进程创建1号内核态进程，1号负责执行内核的部分初始化工作及进行系统配置，并创建若干个用于高速缓存和虚拟贮存管理的内核线程。
随后，1号进程调用execve()运行可执行程序init，并演变为用户态1号进程，即init进程。
1号进程会创建编号为1号、2号…的若干终端注册进程getty，每个getty进程设置其进程组标识号，并检测配置到系统终端的接口线路。
当检测到来自终端的连接信号时，getty进程将通过函数execve()执行注册程序login，此时用户就可以输入注册名和密码进入登录过程。
登录成功后，由login程序再通过函数execv()执行shell，该shell进程¹接收getty进程的pid，取代原来的getty进程。
再由shell直接或间接地产生其他进程。

综上：0号进程——>1号内核进程——>1号内核线程——>1号用户进程（init进程）——>getty进程——>shell进程

1. 进程的创建——fork()函数

Linux系统下使用fork()函数创建一个子进程，其函数原型如下：

#include<unistd.h>
pid_t fork(void);

fork函数的返回值有三种情况：

对于父进程，fork()函数返回新创建的子进程的ID；
对于子进程，fork()函数返回0；
如果创建出错，fork()函数返回-1.

fork()函数会创建一个新的进程，并从内核中为此进程分配一个新的进程标识符（PID），之后，为这个新进程分配进程空间，并将父进程的内容复制到子进程的进程空间中，包括父进程的数据段和堆栈段，但是代码段是只读的，不存在被修改的问题，所以共用代码段。

由于在复制时复制了父进程的堆栈段，所以两个进程都停留在fork()函数中，等待返回。因此，fork()函数会返回两次，一次是在父进程中返回，另一次是在子进程中返回，这里两次的返回值时不一样的。

代码分析：

《后台开发：核心技术与应用实践》Page_337：例10.1“创建一个子进程”

#include<stdio.h>
#include<stdlib.h>
#include<unistd.h>

int main()
{
	pid_t pid;
	pid = fork();
	if (pid < 0)
	{
		perror("fail to fork");
		exit(-1);
	}
	else if (pid == 0)	//子进程
		printf("Sub-process, PID: %u, PPID: %u\n", gepid(), getppid());
	else	//父进程
	{
		printf("Parent, PID: %u, Sub-process PID: %u\n", getpid(), pid);
		sleep(2);
	}
	return 0;
}

由于创建的新进程和父进程在系统看来是地位平等的两个进程，运行机会也是一样的，故不能对其执行先后顺序进行假设，先执行哪一个进程取决于系统的调度算法。getpid()是获得当前进程的PID，getppid()是获得父进程的PID。

现代操作系统的“写时复制”概念：

现在的Linux内核在实现fork()函数时往往在创建子进程时并不会立即复制父进程的数据段和堆栈段，而是当子进程修改这些数据内容时复制操作才会发生，内核才会给子进程分配进程空间，将父进程的内容复制过来，然后继续后面的操作。这样的实现更加合理，对于一些只是为了复制自身完成一些工作的进程来说，这样做的效率更高。