Linux 详谈从冯诺依曼体系结构到进程

最新推荐文章于 2025-12-23 17:28:54 发布

原创最新推荐文章于 2025-12-23 17:28:54 发布 · 1k 阅读

28 ·

CC 4.0 BY-SA版权

文章标签：

#linux #运维 #服务器 #后端

Linux 专栏收录该内容

20 篇文章

订阅专栏

前言

冯诺依曼体系结构

操作系统(Operator System)

前言

前面我们聊了Linux操作系统下的基础的命令, 以及Vim编辑器的使用, 这一部分呢, 我们就真正开始聊一聊Linux操作系统中的系统相关的概念和知识点~

冯诺依曼体系结构

我们常⻅的计算机，如笔记本。我们不常⻅的计算机，如服务器，⼤部分都遵守冯诺依曼体系。截⾄⽬前，我们所认识的计算机，都是由⼀个个的硬件组件组成:

输⼊单元：包括键盘, ⿏标，扫描仪, 写板等

中央处理器(CPU)：含有运算器和控制器等

输出单元：显⽰器，打印机等

关于冯诺依曼，必须强调⼏点：

这⾥的存储器指的是内存

不考虑缓存情况，这⾥的CPU能且只能对内存进⾏读写，不能访问外设(输⼊或输出设备)

外设(输⼊或输出设备)要输⼊或者输出数据，也只能写⼊内存或者从内存中读取。

⼀句话，所有设备都只能直接和内存打交道。

操作系统(Operator System)

概念

任何计算机系统都包含⼀个基本的程序集合，称为操作系统(OS)。笼统的理解，操作系统包括：

内核（进程管理，内存管理，⽂件管理，驱动管理）

其他程序（例如函数库，shell程序等等）

设计OS的⽬的

对下，与硬件交互，管理所有的软硬件资源

对上，为⽤⼾程序（应⽤程序）提供⼀个良好的执⾏环境

核⼼功能

在整个计算机软硬件架构中，操作系统的定位是：⼀款纯正的“搞管理”的软件

如何理解 "管理"

管理的例⼦ - 学⽣，辅导员，校⻓

描述被管理对象

组织被管理对象

总结:

计算机管理硬件:

描述起来，⽤struct结构体

组织起来，⽤链表或其他⾼效的数据结构

系统调⽤和库函数概念

在开发⻆度，操作系统对外会表现为⼀个整体，但是会暴露⾃⼰的部分接⼝，供上层开发使⽤，这部分由操作系统提供的接⼝，叫做系统调⽤。

系统调⽤在使⽤上，功能⽐较基础，对⽤⼾的要求相对也⽐较⾼，所以，有⼼的开发者可以对部分系统调⽤进⾏适度封装，从⽽形成库，有了库，就很有利于更上层⽤⼾或者开发者进⾏⼆次开发。

那在还没有学习进程之前，就问⼤家，操作系统是怎么管理进⾏进程管理的呢？很简单，先把进程描述起来，再把进程组织起来！

这个地方也能看得出来: 当前世界中的盛行编程语言, C++, Java, Golang, 都会提供组织数据的方式.

进程

基本概念与基本操作

课本概念：程序的⼀个执⾏实例，正在执⾏的程序等

内核观点：担当分配系统资源（CPU时间，内存）的实体

描述进程-PCB

基本概念

进程信息被放在⼀个叫做进程控制块的数据结构中，可以理解为进程属性的集合。

课本上称之为PCB（process control block），Linux操作系统下的PCB是: task_struct

task_struct-PCB的⼀种

在Linux中描述进程的结构体叫做task_struct。

task_struct是Linux内核的⼀种数据结构，它会被装载到RAM(内存)⾥并且包含着进程的信息。

task_ struct

内容分类

标⽰符: 描述本进程的唯⼀标⽰符，⽤来区别其他进程。

状态: 任务状态，退出代码，退出信号等。

优先级: 相对于其他进程的优先级。

程序计数器: 程序中即将被执⾏的下⼀条指令的地址。

内存指针: 包括程序代码和进程相关数据的指针，还有和其他进程共享的内存块的指针

上下⽂数据: 进程执⾏时处理器的寄存器中的数据[休学例⼦，要加图CPU，寄存器]。

I∕O状态信息: 包括显⽰的I/O请求,分配给进程的I∕O设备和被进程使⽤的⽂件列表。

记账信息: 可能包括处理器时间总和，使⽤的时钟数总和，时间限制，记账号等。

其他信息

组织进程

可以在内核源代码⾥找到它。所有运⾏在系统⾥的进程都以task_struct链表的形式存在内核⾥。

查看进程

进程的信息可以通过 /proc 系统⽂件夹查看

如：要获取PID为1的进程信息，你需要查看 /proc/1 这个⽂件夹。

⼤多数进程信息同样可以使⽤top和ps这些⽤⼾级⼯具来获取

#include <stdio.h>
#include <sys/types.h>
#include <unistd.h>
int main()
{
    while(1){
        sleep(1);
    }
    return 0;
}

通过系统调⽤获取进程标⽰符

进程id（PID）

⽗进程id（PPID）

#include <stdio.h>
#include <sys/types.h>
#include <unistd.h>
int main()
{
    printf("pid: %d\n", getpid());
    printf("ppid: %d\n", getppid());
    return 0;
}

通过系统调⽤创建进程-fork初识

运⾏ man fork 认识fork

fork有两个返回值

⽗⼦进程代码共享，数据各⾃开辟空间，私有⼀份（采⽤写时拷⻉）

#include <stdio.h>
#include <sys/types.h>
#include <unistd.h>
int main()
{
    int ret = fork();
    printf("hello proc : %d!, ret: %d\n", getpid(), ret);
    sleep(1);
    return 0;
}

fork 之后通常要⽤ if 进⾏分流

#include <stdio.h>
#include <sys/types.h>
#include <unistd.h>
int main()
{
    int ret = fork();
    if(ret < 0){
        perror("fork");
    return 1;
}
    else if(ret == 0){ //child
        printf("I am child : %d!, ret: %d\n", getpid(), ret);
    }else{ //father
        printf("I am father : %d!, ret: %d\n", getpid(), ret);
    }
    sleep(1);
    return 0;
}

进程状态

Linux内核源代码怎么说

为了弄明⽩正在运⾏的进程是什么意思，我们需要知道进程的不同状态。⼀个进程可以有⼏个状态（在Linux内核⾥，进程有时候也叫做任务）。下⾯的状态在kernel源代码⾥定义：

/*
*The task state array is a strange "bitmap" of
*reasons to sleep. Thus "running" is zero, and
*you can test for combinations of others with
*simple bit tests.
*/
static const char *const task_state_array[] = {
    "R (running)", /*0 */
    "S (sleeping)", /*1 */
    "D (disk sleep)", /*2 */
    "T (stopped)", /*4 */
    "t (tracing stop)", /*8 */
    "X (dead)", /*16 */
    "Z (zombie)", /*32 */
};

R运⾏状态（running）: 并不意味着进程⼀定在运⾏中，它表明进程要么是在运⾏中要么在运⾏队列⾥。

S睡眠状态（sleeping): 意味着进程在等待事件完成（这⾥的睡眠有时候也叫做可中断睡眠（interruptible sleep））。

D磁盘休眠状态（Disk sleep）有时候也叫不可中断睡眠状态（uninterruptible sleep），在这个状态的进程通常会等待IO的结束。

T停⽌状态（stopped）：可以通过发送 SIGSTOP 信号给进程来停⽌（T）进程。这个被暂停的进程可以通过发送 SIGCONT 信号让进程继续运⾏。

X死亡状态（dead）：这个状态只是⼀个返回状态，你不会在任务列表⾥看到这个状态。

进程状态查看

ps aux / ps axj 命令

a：显⽰⼀个终端所有的进程，包括其他⽤⼾的进程。

x：显⽰没有控制终端的进程，例如后台运⾏的守护进程。

j：显⽰进程归属的进程组ID、会话ID、⽗进程ID，以及与作业控制相关的信息

u：以⽤⼾为中⼼的格式显⽰进程信息，提供进程的详细信息，如⽤⼾、CPU和内存使⽤情况等

Z(zombie)-僵⼫进程

僵死状态（Zombies）是⼀个⽐较特殊的状态。当进程退出并且⽗进程（使⽤wait()系统调⽤,后⾯讲）没有读取到⼦进程退出的返回代码时就会产⽣僵死(⼫)进程

僵死进程会以终⽌状态保持在进程表中，并且会⼀直在等待⽗进程读取退出状态代码。

所以，只要⼦进程退出，⽗进程还在运⾏，但⽗进程没有读取⼦进程状态，⼦进程进⼊Z状态

#include <stdio.h>
#include <stdlib.h>
int main()
{
    pid_t id = fork();
    if(id < 0){
        perror("fork");
        return 1;
    }
    else if(id > 0){ //parent
        printf("parent[%d] is sleeping...\n", getpid());
        sleep(30);
    }else{
        printf("child[%d] is begin Z...\n", getpid());
        sleep(5);
        exit(EXIT_SUCCESS);
    }
    return 0;
}

进程优先级

基本概念

cpu资源分配的先后顺序，就是指进程的优先权（priority）。

优先权⾼的进程有优先执⾏权利。配置进程优先权对多任务环境的linux很有⽤，可以改善系统性能。

还可以把进程运⾏到指定的CPU上，这样⼀来，把不重要的进程安排到某个CPU，可以⼤改善系统整体性能。

查看系统进程

在linux或者unix系统中，⽤ps ‒l命令则会类似输出以下⼏个内容：

我们很容易注意到其中的⼏个重要信息，有下：

UID : 代表执⾏者的⾝份

PID : 代表这个进程的代号

PPID ：代表这个进程是由哪个进程发展衍⽣⽽来的，亦即⽗进程的代号

PRI ：代表这个进程可被执⾏的优先级，其值越⼩越早被执⾏

NI ：代表这个进程的nice值

PRI and NI

PRI也还是⽐较好理解的，即进程的优先级，或者通俗点说就是程序被CPU执⾏的先后顺序，此值越⼩进程的优先级别越⾼

那NI呢?就是我们所要说的nice值了，其表⽰进程可被执⾏的优先级的修正数值

PRI值越⼩越快被执⾏，那么加⼊nice值后，将会使得PRI变为：PRI(new)=PRI(old)+nice

这样，当nice值为负值的时候，那么该程序将会优先级值将变⼩，即其优先级会变⾼，则其越快被执⾏

所以，调整进程优先级，在Linux下，就是调整进程nice值

nice其取值范围是-20⾄19，⼀共40个级别。

PRI vs NI

需要强调⼀点的是，进程的nice值不是进程的优先级，他们不是⼀个概念，但是进程nice值会影响到进程的优先级变化。

可以理解nice值是进程优先级的修正修正数据

进程切换

CPU上下⽂切换：其实际含义是任务切换, 或者CPU寄存器切换。当多任务内核决定运⾏另外的任务时, 它保存正在运⾏任务的当前状态, 也就是CPU寄存器中的全部内容。这些内容被保存在任务⾃⼰的堆栈中, ⼊栈⼯作完成后就把下⼀个将要运⾏的任务的当前状况从该任务的栈中重新装⼊CPU寄存器,并开始下⼀个任务的运⾏, 这⼀过程就是context switch。