转自:浅析Linux下的task_struct结构体_lc_29503203的博客-优快云博客_task_struct
本文的重点是剖析task_struct,在这之前我们需要先了解一下进程的概念和Linux下进程控制块PCB。
1. 首先什么是进程?
1.1 进程可以这样描述:
1>进程是程序的一个执行实例;
2>进程是正在执行的程序;
3>进程是能分配处理器并由处理器执行的实体。
按内核观点来谈进程:它担当分配系统资源(CPU时间,内存)的实体。
1.2 进程的两个基本元素
一是程序代码(可能被执行相同程序的其他进程共享),二是和代码相关联的数据集。这里的“和代码相关联的数据集指的是数据段和进程控制块”。进程是一种动态描述,但是并不代表所有的进程都在运行。(进程在内存中因策略或调度需求,会处于各种状态)。
1.3 这里再明确以下几点:
(1)操作系统执行程序的过程:
(2)进程是动态运行的实例,但是并不是所有的进程都在运行,这前后两句话并不矛盾,因为程序被加载到内存中后,它的执行由进程的状态以及调度算法等来决定。
2. 进程的描述
上面我们已经提到过PCB,那么PCB到底是用来干什么的呢?
学了操作系统后,我们都知道操作系统要想管理一个对象,它不是直接进行管理的,而是通过得到被管理者的一些有效信息加以管理的,因此在这里我们也可以这样理解,操作系统管理进程,实则是将进程的有效信息提取出来然后通过管理这些信息来管理进程,而所有的进程信息被存放在一个叫做进程控制块的数据结构中(可以理解为进程属性的集合),这也就是即将要介绍的进程控制块(PCB).
每个进程在内核中都有一个进程控制块(PCB)来维护进程相关的信息,Linux内核的进程控制块是task_struct结构体.
task_struct是Linux内核的一种数据结构,它会被装载到RAM中并且包含着进程的信息。每个进程都把它的信息放在 task_struct 这个数据结构体,task_struct 包含了这些内容:
(1)标示符 : 描述本进程的唯一标识符,用来区别其他进程。
(2)状态 :任务状态,退出代码,退出信号等。
(3)优先级 :相对于其他进程的优先级。
(4)程序计数器:程序中即将被执行的下一条指令的地址。
(5)内存指针:包括程序代码和进程相关数据的指针,还有和其他进程共享的内存块的指针。
(6)上下文数据:进程执行时处理器的寄存器中的数据。
(7) I/O状态信息:包括显示的I/O请求,分配给进程的I/O设备和被进程使用的文件列表。
(8) 记账信息:可能包括处理器时间总和,使用的时钟数总和,时间限制,记账号等。
有关进程信息还有以下三点需要了解:
1>保存进程信息的数据结构叫做 task_struct,可以在 include/linux/sched.h 中找到它;
2>所有运行在系统中的进程都以 task_struct 链表的形式存在内核中;
3>进程的信息可以通过 /proc 系统文件夹查看。要获取PID为400的进程信息,你需要查看 /proc/400 这个文件夹。大多数进程信息同样可以使用top和ps这些用户级工具来获取,例如:
3.剖析task_struct结构体
(1)进程的状态
volatile long state;
state的可能取值为:
#define TASK_RUNNING 0//进程要么正在执行,要么准备执行
#define TASK_INTERRUPTIBLE 1 //可中断的睡眠,可以通过一个信号唤醒
#define TASK_UNINTERRUPTIBLE 2 //不可中断睡眠,不可以通过信号进行唤醒
#define __TASK_STOPPED 4 //进程停止执行
#define __TASK_TRACED 8 //进程被追踪
/* in tsk->exit_state */
#define EXIT_ZOMBIE 16 //僵尸状态的进程,表示进程被终止,但是父进程还没有获取它的终止信息,比如进程有没有执行完等信息。
#define EXIT_DEAD 32 //进程的最终状态,进程死亡
/* in tsk->state again */
#define TASK_DEAD 64 //死亡
#define TASK_WAKEKILL 128 //唤醒并杀死的进程
#define TASK_WAKING 256 //唤醒进程
(2)进程的唯一标识(pid)