进程 、PCB与进程分配资源(摘抄)
进程 、PCB与进程分配资源(摘抄)
进程
组成:
- 程序代码 : 描述了进程需要完成的功能。
- 数据集和栈 : 数据集、栈:程序在执行时所需要的数据和工作区。
- 进程控制块(Process Control Block):包含进程的描述信息和控制信息,它是进程存在的唯一标识。
调度算法
进程之间需要竞争资源,一般都是竞争 CPU 资源,因为 CPU 运行速度太快了,其他介质都赶不上。
1.FCFS(先来先服务)
最先进入就绪队列的进程,先运行,运行到完成或者阻塞时,再重新调度。一般情况下,这种调度算法会和优先级策略结合,比如每个优先级一条队列,每条队列中的调度都使用 FCFS。
特点:简单、比较偏于长进程、相对于其他调度算法平均周转时间长。
2.RR(轮转)
进程按提交顺序存在就绪队列,依次轮流占用 CPU 资源,运行一段固定的时间,时间到后如果还没执行完,就继续进入就绪队列队尾,排队等待下次执行。
特点:公平、对进程的响应时间较短。
3、SPN
Shortest Process Next(最短进程优先):将预期占用运行时间最短的进程优先执行,直到运行完成或阻塞时,再重新调度。
特点:有利于短进程。
4.SRT
Shortest Remaining Time(最短剩余时间优先):新进程进来时,如果新进程的预计运行时间比当前进程的剩余运行时间更短,就会抢占当前进程。
特点:有利于短进程,和 SPN 的差别在于抢占这个一点,因为抢占,所以效率会比 SPN 好一些。
5.HRRN
Highest Response Ratio Next(最高响应比优先):当前运行的进程完成或者阻塞时发生调度,每次调度前,计算所有就绪进程的响应比,响应比高的进程优先运行。
相应比公式:

有利于短进程,服务时间相同的进程,先来的服务会优先执行,长进程因为在等待的过程中,优先级越来越高,所以不会一直不执行。
6.FB
FeedBack(反馈):由多个就绪队列组成的反馈机制,它有如下规则:
1.在同一个队列的进程,按 FCFS 算法调度,最后一个就绪队列按 RR 算法调度;
2.优先级越高的队列,时间片越小;
3.进程在一个时间片内未运行完,则降到下一个队列末尾;
4.只有上级队列无就绪进程时,才运行本级就绪队列,本级就绪队列无进程时,才运行下级就绪队列,以此类推;
进程执行过程如下:

特点:短进程有非常大的优势,排在前面的队列都是时间较短的。
进程状态
1.Read(就绪态):进程已得到除 CPU 以外的其他所需资源。
2.Running(运行态):进程的指令正被执行。
3.Blocked(阻塞态):进程正等待资源或某事件发生。
4.New(新建态):进程正被创建。分配内存后将被设为就绪态。
5.Exit(退出态):进程已正常结束或出现异常结束。回收资源。
三态图示关系如下:

说明: 就绪态的进程在被调度的时候,进入了运行态,如果时间片运行完或者有更高级别进程抢占资源,则变成就绪态等待再次被调度;如果发生事件(比如 IO 事件),则从运行态转到阻塞态,进入阻塞态的进程只能等待事件解除重新进入就绪态。
五态图示关系如下:

说明: 新进程刚创建还没有分配资源的时候是新建态,等到分配了资源,被加载后就进入就绪态。当进程运行完后,就从运行态进入退出态。
执行模式
指令分为特权指令(只能由操作系统内核使用的指令)和非特权指令(只能由用户程序使用的指令),因为指令有特权和非特权之分,所以 CPU 也分为 2 种执行模式:系统态(可以执行所有指令,使用所有资源以及改变 CPU 状态)用户态(只能执行非特权指令)。

进程通讯
1.管道(Pipe)
管道是半双工通讯,数据是单向流动,要建立进程间互相通讯,则需要 2 个管道,这种通讯方式只能在亲戚关系的进程间使用,比如父子进程。

2.信号量(Semophore)
信号量相当于计数器,利用它来控制多个进程访问共享资源,当一个进程A在访问共享资源时,信号量防止其他进程来访问,只有当进程A不访问共享资源了,其他进程才能访问。
信号量用于实现进程间的互斥与同步,而不是用于存储进程间通信数据。
1.信号量用于进程间同步,若要在进程间传递数据需要结合共享内存。
2.信号量基于操作系统的 PV 操作,程序对信号量的操作都是原子操作。
3.每次对信号量的 PV 操作不仅限于对信号量值加 1 或减 1,而且可以加减任意正整数。
4.支持信号量组
3.消息队列(Message Queue)
消息队列,是消息的链接表,存放在内核中。一个消息队列由一个标识符(即队列ID)来标识。
消息队列是存放在内核中的链表,可以有多个进程对这个链表进行写入和读取,它解决了信号传递信息少、管道只能传输无格式字节流和缓冲区大小受限的缺点。

4.共享内存(Shared Memory)
共享内存即为一段能被其他进程访问的内存,多个进程访问同一个内存,达到了通讯的效果。

程序段
1.程序段包含了进程执行的机器代码,是代码文本的一个副本。
2.对于同一个程序,每个进程都有各自的程序段,存储着要执行的代码指令,这段代码可以来自执行文件或共享库。
3.程序段与数据段不同,它是只读的,也是共享的,多个进程可以共享同一个程序段。
数据段
1.数据段保存了进程执行过程中需要操作的数据,所有进程变量都保存在数据段中。
2.数据段属于进程的私有部分,每个进程都有属于自己的数据段,其中所保存的数据只能被本进程访问,不同进程的数据段是隔离的。数据段又分为初始化数据段和未初始化数据段。
3.初始化数据段:保存了程序中已经初始化过的数据,包括全局变量和静态变量。
4.未初始化数据段:保存程序中没有初始化的数据,包括全局变量和静态变量。
5.数据段随着进程的运行而改变,执行结束后也会被操作系统回收。
PCB(Process Control Block)
进程控制块。操作系统中用于管理进程的数据结构,它包含了进程的所有状态信息。PCB的大小取决于操作系统的实现和支持的功能,不同的操作系统和不同的进程可能有不同的PCB大小。
PCB存储在内核中,其中包含了操作系统需要控制该进程的所有信息。每当创建一个新的进程,操作系统就会为它分配一个PCB,以用于维护进程的执行上下文。

PCB 主要包含信息
1. 进程状态: 进程当前所处的运行状态(运行、就绪、阻塞等)
2. 程序计数器: 记录下一条要执行的指令地址
3. 寄存器集:保存和恢复进程上下文所需的全部寄存器
4. 内存管理信息: 记录进程所占用的内存页面等信息
5. 打开文件描述符: 进程打开文件的描述符表
6. 信号与信号处理函数: 发送给进程的信号及其处理函数
7. 进程优先级: 用于决定调度顺序
8. 进程标识符: 进程的唯一标识 ID
9. 调度信息: 进程的调度参数
10 进程链: 同属一个作业的进程链表指针
Linux中的PCB——task_struct
struct task_struct {
volatile long state; //说明了该进程是否可以执行,还是可中断等信息
unsigned long flags; //Flage 是进程号,在调用fork()时给出
intsigpending; //进程上是否有待处理的信号
mm_segment_taddr_limit; //进程地址空间,区分内核进程与普通进程在内存存放的位置不同
//0-0xBFFFFFFF foruser-thead
//0-0xFFFFFFFF forkernel-thread
//调度标志,表示该进程是否需要重新调度,若非0,则当从内核态返回到用户态,会发生调度
volatilelong need_resched;
int lock_depth; //锁深度
longnice; //进程的基本时间片
//进程的调度策略,有三种,实时进程:SCHED_FIFO,SCHED_RR,分时进程:SCHED_OTHER
unsigned long policy;
struct mm_struct *mm; //进程内存管理信息
int processor;
//若进程不在任何CPU上运行, cpus_runnable 的值是0,否则是1这个值在运行队列被锁时更新
unsigned long cpus_runnable, cpus_allowed;
struct list_head run_list; //指向运行队列的指针
unsigned longsleep_time; //进程的睡眠时间
//用于将系统中所有的进程连成一个双向循环链表,其根是init_task
struct task_struct *next_task, *prev_task;
struct mm_struct *active_mm;
struct list_headlocal_pages; //指向本地页面
unsigned int allocation_order, nr_local_pages;
struct linux_binfmt *binfmt; //进程所运行的可执行文件的格式
int exit_code, exit_signal;
intpdeath_signal; //父进程终止是向子进程发送的信号
unsigned longpersonality;
//Linux可以运行由其他UNIX操作系统生成的符合iBCS2标准的程序
intdid_exec:1;
pid_tpid; //进程标识符,用来代表一个进程
pid_tpgrp; //进程组标识,表示进程所属的进程组
pid_t tty_old_pgrp; //进程控制终端所在的组标识
pid_tsession; //进程的会话标识
pid_t tgid;
intleader; //表示进程是否为会话主管
struct task_struct*p_opptr,*p_pptr,*p_cptr,*p_ysptr,*p_osptr;
struct list_head thread_group; //线程链表
struct task_struct*pidhash_next; //用于将进程链入HASH表
struct task_struct**pidhash_pprev;
wait_queue_head_t wait_chldexit; //供wait4()使用
struct completion*vfork_done; //供vfork()使用
unsigned long rt_priority; //实时优先级,用它计算实时进程调度时的weight值
//it_real_value,it_real_incr用于REAL定时器,单位为jiffies,系统根据it_real_value
//设置定时器的第一个终止时间.在定时器到期时,向进程发送SIGALRM信号,同时根据
//it_real_incr重置终止时间,it_prof_value,it_prof_incr用于Profile定时器,单位为jiffies。
//当进程运行时,不管在何种状态下,每个tick都使it_prof_value值减一,当减到0时,向进程发送
//信号SIGPROF,并根据it_prof_incr重置时间.
//it_virt_value,it_virt_value用于Virtual定时器,单位为jiffies。当进程运行时,不管在何种
//状态下,每个tick都使it_virt_value值减一当减到0时,向进程发送信号SIGVTALRM,根据
//it_virt_incr重置初值。
unsigned long it_real_value, it_prof_value, it_virt_value;
unsigned long it_real_incr, it_prof_incr, it_virt_value;
struct timer_listreal_timer; //指向实时定时器的指针
struct tmstimes; //记录进程消耗的时间
unsigned longstart_time; //进程创建的时间
//记录进程在每个CPU上所消耗的用户态时间和核心态时间
longper_cpu_utime[NR_CPUS],per_cpu_stime[NR_CPUS];
//内存缺页和交换信息:
//min_flt, maj_flt累计进程的次缺页数(Copyon Write页和匿名页)和主缺页数(从映射文件或交换
//设备读入的页面数);nswap记录进程累计换出的页面数,即写到交换设备上的页面数。
//cmin_flt, cmaj_flt,cnswap记录本进程为祖先的所有子孙进程的累计次缺页数,主缺页数和换出页面数。
//在父进程回收终止的子进程时,父进程会将子进程的这些信息累计到自己结构的这些域中
unsignedlong min_flt, maj_flt, nswap, cmin_flt, cmaj_flt, cnswap;
int swappable:1; //表示进程的虚拟地址空间是否允许换出
//进程认证信息
//uid,gid为运行该进程的用户的用户标识符和组标识符,通常是进程创建者的uid,gid
//euid,egid为有效uid,gid
//fsuid,fsgid为文件系统uid,gid,这两个ID号通常与有效uid,gid相等,在检查对于文件
//系统的访问权限时使用他们。
//suid,sgid为备份uid,gid
uid_t uid,euid,suid,fsuid;
gid_t gid,egid,sgid,fsgid;
int ngroups; //记录进程在多少个用户组中
gid_t groups[NGROUPS]; //记录进程所在的组
//进程的权能,分别是有效位集合,继承位集合,允许位集合
kernel_cap_tcap_effective, cap_inheritable, cap_permitted;
int keep_capabilities:1;
struct user_struct *user;
struct rlimit rlim[RLIM_NLIMITS]; //与进程相关的资源限制信息
unsigned shortused_math; //是否使用FPU
charcomm[16]; //进程正在运行的可执行文件名
//文件系统信息
int link_count, total_link_count;
//NULL if no tty进程所在的控制终端,如果不需要控制终端,则该指针为空
struct tty_struct*tty;
unsigned int locks;
//进程间通信信息
struct sem_undo*semundo; //进程在信号灯上的所有undo操作
struct sem_queue *semsleeping; //当进程因为信号灯操作而挂起时,他在该队列中记录等待的操作
//进程的CPU状态,切换时,要保存到停止进程的task_struct中
structthread_struct thread;
//文件系统信息
struct fs_struct *fs;
//打开文件信息
struct files_struct *files;
//信号处理函数
spinlock_t sigmask_lock;
struct signal_struct *sig; //信号处理函数
sigset_t blocked; //进程当前要阻塞的信号,每个信号对应一位
struct sigpendingpending; //进程上是否有待处理的信号
unsigned long sas_ss_sp;
size_t sas_ss_size;
int (*notifier)(void *priv);
void *notifier_data;
sigset_t *notifier_mask;
u32 parent_exec_id;
u32 self_exec_id;
spinlock_t alloc_lock;
void *journal_info;
};
/**
标识相关:pid,ppid等等
文件相关:进程需要记录打开的文件信息,于是需要文件描述符表
内存相关:内存指针,指向进程的虚拟地址空间(用户空间)信息
优先级相关:进程相对于其他进程的调度优先级
上下文信息相关:CPU的所有寄存器中的值、进程的状态以及堆栈上的内容,当内核需要切换到另一个进程时,需要保存当前进程的所有状态,即保存当前进程的进程上下文,以便再次执行该进程时,能够恢复切换时的状态,继续执行。
状态相关:进程当前的状态,说明该进程处于什么状态
信号相关:进程的信号处理函数,以及记录当前进程是否还有待处理的信号
I/O相关:记录进程与各种I/O设备之间的交互
**/
进程内存分配
每个进程运行的时候,都会拿到4G的虚拟内存,在32位Linux下,其中3G是交给用户的,1G是交给内核的,而task_struct就是存储在这1G的内核系统空间中。
每个进程都有各自的私有用户空间(0-3G),这个空间对系统中的其他进程是不可见的。
最高的1GB内核空间则为所有进程以及内核所共享。
至于为什么需要这个1G的内核空间,是因为进程需要调用一些系统调用,来交给内核跑,程序的一部分逻辑可能是要交给内核去跑的,所以一部分虚拟地址必须要留给内核使用。
图示如下:

注:
本文全部摘抄,无自创内容!
原文地址
- https://blog.youkuaiyun.com/lvyibin890/article/details/82193900
- https://blog.youkuaiyun.com/qq_61939403/article/details/128696391
- https://blog.youkuaiyun.com/TYtrack/article/details/104356782

被折叠的 条评论
为什么被折叠?



