Linux进程理解【进程认识】

最新推荐文章于 2024-07-23 08:30:29 发布

茉莉蜜茶v

最新推荐文章于 2024-07-23 08:30:29 发布

阅读量184

点赞数 4

分类专栏： Linux 文章标签： linux 操作系统进程

本文链接：https://blog.youkuaiyun.com/cw412524/article/details/131702953

版权

Linux 专栏收录该内容

17 篇文章

订阅专栏

文章介绍了Linux进程的基本概念，包括进程的独立性、进程控制块PCB以及父子进程的关系。通过冯诺依曼体系结构解释了内存的作用，探讨了操作系统如何管理和控制进程，并通过示例展示了如何创建和管理子进程。此外，还讨论了进程间的独立性和数据共享的写时拷贝机制。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Linux进程理解【进程认识】

进程（Process）是计算机中的程序关于某数据集合上的一次运行活动，是系统进行资源分配的基本单位，是操作系统结构的基础。在早期面向进程设计的计算机结构中，进程是程序的基本执行实体；在当代面向线程设计的计算机结构中，进程是线程的容器。程序是指令、数据及其组织形式的描述，进程是程序的实体

概念生涩难懂，稍作了解即可，下面正文开始，我将带领大家一步步搞懂进程的相关知识

1. 冯诺依曼体系结构

我们常见的计算机，如笔记本。我们不常见的计算机，如服务器，大部分都遵守冯诺依曼体系，他提出计算机由五部分组成，即输入设备、存储器、运算器、控制器、输出设备

来解释一个问题，为什么要有存储器(内存)？

这里的存储器指的就是内存，输入、输出设备都是外设，而外设的数据传输速度都很慢，但是内存的数据传输速度很快，CPU的速度是最快的，内存的存在可以将输入、输出设备的数据预加载到内存中，CPU在进行计算时，直接从内存中加载数据即可，这样就避免了大量数据被阻塞，如果没有内存，那么计算机的速度就要取决于速度最慢的外设了

总结：

不考虑缓存情况，这里的CPU能且只能对内存进行读写，不能访问外设，外设要输入或者输出数据，也只能写入内存或者从内存中读取
简单来说就是，所有设备(外设)都只能直接和内存打交道

2. 操作系统(Operator System)

有了计算机体系，在我们执行程序时往往是面临多层任务，这就需要操作系统(OS)来进行管理了，操作系统(OS)是一款软硬件资源管理的软件，所有的软件要运行数据都是加载到内存中

举个大学中的例子，这里校长就是管理者，他的工作就是决策，辅导员来执行决策，而学生则是来参与决策，类比到计算机中这里的学生就相当于是硬件或者软件，这里的辅导员扮演的角色是硬件驱动，校长就相当于操作系统，形成操作系统 -> 硬件驱动 -> 软硬件的管理方式

计算机管理的本质：先描述，再组织

接着上面的例子来解释一下，这里校长使用struct结构体对学生的姓名、学号等进行描述，使用链表结构来组织管理这些学生的信息

计算机管理硬件

描述起来，用struct结构体
组织起来，用链表或其他高效的数据结构

操作系统为什么要对软硬件资源进行管理呢？

操作系统通过对下管理好软硬件资源（手段），对上给用户提供良好（安全，稳定，高效等）的执行环境（目的）

系统调用和库函数概念

操作系统给我们提供非常良好的服务，并不代表操作系统相信我们，操作系统不相信任何用户，操作系统为了保证服务和自身安全，是以接口的形式来提供服务的，在开发角度，操作系统对外会表现为一个整体，但是会暴露自己的部分接口，供上层开发使用，这部分由操作系统提供的接口，叫做系统调用，库函数和系统调用的关系就是，库函数可能调用系统调用，但不是所有库函数
举个例子，就像是银行为我们提供良好的服务，但是银行并不会信任我们，其为我们提供服务都是基于在每个柜台窗口办理的，这样既能保证优质服务，又能保证其内部自身的安全

计算机体系结构图

3. 进程理解

3.1 进程概念

先来看看Windows下的进程，我们会发现多个进程在同时进行，结束其中一个进程并不会影响其他进程的运行，这就说明进程是具有独立性的

提供结论：任何启动或运行程序的行为最终都由操作系统帮助我们来将程序转换称为进程完成特定的任务

操作系统对于加载到内存中的程序如何管理呢？

在Linux下我们的可执行程序就是一个文件，程序运行时它就会从磁盘中加载到内存中，加载的内容是程序的代码和数据，只是这样并不能被称为进程，这只是完成了加载数据和代码，并没有说明操作系统对其进行管理。当磁盘中加载到内存的程序有很多个时，为了避免阻塞混乱，操作系统就必须对其做管理了，所以操作系统必须管理进程

操作系统如何管理进程呢？

当然是：先描述，再组织，先描述就是对其每个进程创建一个数据结构对象，这个数据结构课本上称为PCB(process control block)，Linux操作系统下的PCB是task_struct，这个结构中包含进程的所有相关属性

有上面的铺垫我们就能顺理成章的引入进程的概念了

进程概念：

进程由内核关于进程的相关数据结构和进程相关的代码和数据组成

3.2 代码和数据

每个进程都有自己的代码和数据，包括修改时间、所处位置等

3.3 进程控制块

上面已经提到了进程控制块PCB，Linux下的PCB就是task_struct，下面我们来看看其中的相关内容

使用ps指令来查看正在运行的进程信息

ps ajx  //查看进程块信息
ps ajx | head -1 && ps ajx | grep 进程名 | grep -v grep  //查看指定进程信息

task_struct进程控制块内容：

标示符: 描述本进程的唯一标示符，用来区别其他进程
状态: 任务状态，退出代码，退出信号等
优先级: 相对于其他进程的优先级
程序计数器: 程序中即将被执行的下一条指令的地址
内存指针: 包括程序代码和进程相关数据的指针，还有和其他进程共享的内存块的指针
上下文数据: 进程执行时处理器的寄存器中的数据
I/O状态信息: 包括显示的I/O请求,分配给进程的I/O设备和被进程使用的文件列表
记账信息: 可能包括处理器时间总和，使用的时钟数总和，时间限制，记账号等
其他信息

3.4 进程见面

下面我们来编写一个简单的代码通过上面的ps指令来查看进程信息

可以查看到进程的相关信息，这里的PID就是进程标识符，PPID就是父进程标识符

通过系统调用函数获取进程标识符

getpid()   //获取进程id(PID)
pid_t = getpid(void);
getppid()  //获取父进程id(PPID) 
pid_t = getppid(void);

两个函数的使用方法是一样的，我们稍微改造代码来看看

#include <stdio.h>
#include <unistd.h>
 
int main()
{
	int ret = 0;
	while(1)
	{
		printf("我是一个进程，我已经运行了%d秒, 我的PID是：%d\n", ret, getpid());                                     
		sleep(1);
		ret++;
	}
	return 0;
}

这里我们可以观察到查看到的PID与进程PID是一致的，但是当程序重新运行后，会重新生成PID

所有的进程信息都存储在/porc目录中，我们也可以进入此目录下查看进程信息

3.5 父子进程

同样可以稍微改写代码，使用getppid()函数来查看父进程id(PPID)

上面我们说过，当程序重新运行后，会重新生成PID，但是父进程的PPID是不会变化的，这是因为程序的父进程就是bash，bash命令行解析器本质上也是一个进程，命令行启动的所有程序最终都会变成进程，该进程对应的父进程就是是bash

终止进程：

通过kill -9 PID，来终止进程，当然也可以加PPID来终止父进程
通过ctrl + c，来终止进程，它的本质也是kill -9 PID来终止

3.6 创建子进程

使用系统调用接口fork，创建子进程

//创建成功，给父进程返回子进程的PID，给子进程返回0；创建失败返回-1给父进程

pid_t fork(void);  //创建子进程

使用样例

#include <stdio.h>
#include <unistd.h>
#include <sys/types.h>
#include <assert.h>

int main()
{
  pid_t ret = fork();
  assert(ret != -1); //创建失败  
  if(ret == 0) //子进程
  {
    while(1)
    {
      printf("我是子进程, 我的PID:%d 我的父进程PPID:%d\n", getpid(), getppid());
      sleep(1);
    }
  }
  else if(ret > 0) //父进程
  {
    while(1)
    {
      printf("我是父进程, 我的PID:%d 我的父进程PPID:%d\n", getpid(), getppid());
      sleep(1);
    }
  }
  else
  {
  	printf("进程创建失败！");
  }
  
  return 0;
}

fork函数原理：

fork之后，执行流会变成2个执行流，父进程和子进程谁先运行是不确定的，谁先运行是由调度器决定，通常我们通过if和else if来进行执行流分流
创建子进程并不是又多了一份代码和数据，而是新建了一个子进程的PCB，将父进程PCB中的大部分数据拷贝过来，两者共享一份代码和数据。这里的父子进程是具有独立性的，一个关闭，另外一个不受影响