OS引入进程,使系统中的多道程序并发执行,这不仅有效的改善资源的利用率,还显著提高了系统吞吐量,但是同时使得系统变得更加复杂,为了保证多个进程有条不紊的运行,必须引入进程同步机制。
4.1进程同步的级别概念
4.1.1 同步与互斥
1.互斥关系(间接相互制约关系)
互斥也称间接制约关系。当一个进程进入临界区使用临界资源,另一进程必须等待当占用临界资源的进程退出临界区后,另一进程才能访问此临界资源。
遵循原则:
- 空闲让进。临界区空闲时,可以允许一个请求进入临界区的进程立即进入临界区;
- 忙则等待。当已有进程进入临界区时,其他图进入临界区进必须等待
- 有限等待。对请求访问的进程,应保证能在有限时间内进入临界区(保证不会饥饿)
- 让权等待。当进程不能进入临界区时,应立即释放处理机,防止进程忙等待。
2.同步关系(直接相互制约关系)
-
同步亦称直接制约关系,它是指为完成某种任务而建立的两个或多个进程,这些进程因为需要在某些位置上协调它们的工作次序而产生的制约关系。进程间的直接制约关系就是源于它们之间的相互合作。协作进程间的制约关系可以统称为进程同步。进程同步又可分为同步关系和互斥关系,互斥关系是同步关系的一个特例。(p110)
-
同步进程强调的是保证进程之间的先后次序的约束。如读进程和写进程并发地运行,由于并发必然导致异步性,因此“写数据”和“读数据”两个操作执行的先后顺序是不确定的。而实际应用中,又必须按照“写数据→读数据”的顺序来执行的。
如何解决这种异步问题,就是“进程同步”所讨论的内容。
3.临界资源
系统中某些资源一次只允许一个进程使用,称这样的资源为临界资源。
-
类型:物理设备,如打印机等;可被进程共享的许多变量、数据等
-
临界区:访问临界资源的那段代码。
为了保证临界资源的正确使用,可把临界资源的访问过程分成4个部分:
- 1)进入区。为了进入临界区使用临界资源,在进入区要检查可否进入临界区,若能进入临界区,则应设置正在访问临界区的标志,以阻止其他进程同时进入临界区。
- 2)临界区。进程中访问临界资源的那段代码,又称临界段。
- 3)退出区。将正在访问临界区的标志清除。
- 4)剩余区。代码中的其余部分。
do{
entry section; //进入区
critical section; //临界区
exit section; //退出区
remainder section; //剩余区
}while(true)
4.2 软件同步机制
单标志法(违背“空闲让进”原则)
两个进程在访问完临界区后会把使用临界区的权限转交给另一个进程。也就是说每个进程进入临界区的权限只能被另一个进程赋予。
该算法设置一个公用整型变量turn,用于指示被允许进入临界区的进程编号。、
若某个进程不再进入临界区,则另一个 进程也将无法进入临界区(违背"空闲让进”)
上面的代码如果用turn等于0开始,如果率先得到cpu的进程使p1进程,会使p1进程卡在代码5上,(while循环满足条件虽然没有要执行的语句但是会一直卡在里面),但是当p1的时间片到了,就会给p0进程执行代码,到了p0进入临界区了,又且回到p1进程但是还是继续卡住知道执行了代码3就可以执行进程p1了,但是我们可以发现一个很明显的问题就是,在p1想先访问的时候是不可以访问的,所以这是违法了空闲让进的原则。
双标志法先检查(违背“忙则等待”原则)
在每一个进程访问临界区资源之前,先查看一下临界区资源是否正被访问,若正被访问,该进程需等待:否则,进程才进入自己自己的临界区。
设置一个布尔型数组flag[ ],数组中各个元素用来标记各进程想进入临界区的意愿,比如“flag[0]=ture”意味着0号进程P0现在想要进入临界区。每个进程在进入临界区之前先检查当前有没有别的进程想进入临界区,如果没有,则把自身对应的标志flag设为true,之后开始访问临界区。
优点:不用交替进入,可连续使用
缺点:按序列①⑤②⑥执行时,会同时进入临界区(违背“忙则等待”),Pi进程和Pj进程可能同时进入临界区;检查和修改操作不能一次进行。
3.双标志后检查法
算法思想:双标志先检查法的改版。前一个算法的问题是先“检查”后“上锁”,但是这两个操作又无法一气呵成,因此导致了两个进程同时进入临界区的问题。因此,人们又想到先“上锁”后“检查”的方法,来避免上述问题。
- 缺点:当两个进程几乎同时都想进入临界区时,它们分别将自己的标志值设置为TRUE,并且同时检测对方的状态,发现对方也要进入临界区,于是双方互相谦让,结果谁也进不了临界区,从而导致“饥饿”现象。违背了“空闲让进”和“有限等待”产生饥饿
Peterson 算法
4.peterson算法
算法思想:双标志后检查法中,两个进程都争着想进入临界区,但是谁也不让谁,最后谁都无法进入临界区。Gary L.Peterson想到了一种方法,如果双方都争着想进入临界区,那可以让进程尝试“孔融让梨”,主动让对方先使用临界区。
-
为了防止两个进程为进入临界区而无限期等待,又设置了变量turn,每个进程在先设置自己的标志后再设置turn标志。这时,再同时检测另一个进程状态标志和允许进入标志,以便保证两个进程同时要求进入临界区时,只允许一个进程进入临界区。
-
进程在进入区要做的步骤: ① 主动争取 ② 主动谦让 ③ 检查对方是否也想使用,且最后一次是不是自己说了客气话
-
存在问题:Peterson 算法用软件方法解决了进程互斥问题, 遵循 “空闲让进”、“忙则等待”、“有限等待” 三个原则,但是依然 未遵循 “让权等待” 的原则。
4.3 硬件同步机制
1.关中断
当一个进程正在使用处理机执行它的临界区代码时,要防止其他进程再进入其临界区访问的最简单的方法是:禁止一切中断发生,或称之为屏蔽中断、关中断。
关中断;
临界区;
开中断;
- 优点:简单、高效
- 缺点:不适用于多处理机;只适用于操作系统内核进程,不适用于用户进程(因为开/关中断指令只能运行在内核态,这组指令如果能让用户随意使用会很危险)。有时候不响应中断会造成系统坍塌
2.Test - and - set 指令
简称TS指令,也有地方称为TestAndSetLock指令,或TSL指令TSL指令是用硬件实现的。TS是原子操作,执行的过程不允许被中断,只能一气呵成。以下是用C语言描述的逻辑。
相比软件实现方法,TSL 指令把 上锁和检查操作 用硬件的方式变成了一气呵成的 原子操作 。
- 优点: 实现简单,无需像软件实现方法那样严格检查是否会有逻辑漏洞。适用于多处理机环境。
- 缺点: 不满足 “让权等待” 原则,暂时无法进入临界区的进程会占用CPU并循环执行TSL指令,从而导致 忙等。
3.Swap 指令
有的地方也叫Exchange指令,或简称XCHG指令。Swp指令是用硬件实现的,是原子操作,执行的过程不允许被中断,只能一气呵成。
逻辑上来看 Swap 和 TSL 并无太大区别,都是先记录下此时临界区是否已经被上锁(记录在 old 变量上),再将上锁标记 lock 设置为 true,最后检查 old,如果 old 为 false 则说明之前没有别的进程对临界区上锁,则可跳出循环,进入临界区。Swap 指令优点缺点和TSL指令相同。
- 硬件方法的优点
- 适用于任意数目的进程,不管是单处理机还是多处理机;简单、容易验证其正确性。
- 可以支持进程内有多个临界区,只需为每个临界区设立一个布尔变量。
- 硬件方法的缺点
- 进程等待进入临界区时要耗费处理时间,不能实现让权等待。
- 从等待进程中随机选择一个进入临界区,有进程可能一直选不上,从而导致“饥饿”现象。
4.3.1互斥锁(书上没有)
解决临界区最简单的工具就是互斥锁(mutex lock)。一个进程在进入临界区时获得锁;在退出临界区时释放锁。函数acquire()获得锁,而函数release()释放锁。acquire()和release()是原子操作,由硬件机制完成。
每个互斥锁有一个布尔变量available,表示锁是否可用。如果锁是可用的,调用acquire()会成功,且锁不再可用。当一个进程试图获取不可用的锁时,会被阻塞,直到锁被释放。
acquire(){
while(!available); //忙等待
avilable = false; //获得锁
}
release(){
available = true; //释放锁
}
- 优点:等待期间不用切换进程上下文,多处理器系统中,若上锁的时间短,则等待代价很低
- 缺点:需忙等,进程时间片用完才下处理机,违反“让权等待”;不太适用于单处理机系统,忙等的过程中不可能解锁
4.4 信号量机制
1965,荷兰学者戴克斯特拉(dijkstra)提出信号量机制。1972,图灵奖 。银行家算法、最短路径算法。
荷兰学者所以wait、signal原语常简称为P、V操作(来自荷兰语proberen和 verhogen)。
信号量机制:整型信号量、记录型信号量、AND型信号量、信号量集
一般出现P(S)、V(S)操作没有特别说明默认为记录型信号量
信号量机制:信号量机制是一种功能较强的机制,可用来解决互斥与同步问题,它只能被两个标准的原语wait(S)和signal(S)访问,也可记为“P操作"和"V操作”。
信号量其实就是一个变量(可以是一个整数,也可以是更复杂的记录型变量),可以用一个信号量来表示系统中某种资源的数量,比如:系统中只有一台打印机,就可以设置一个初值为1的信号量。
原语是一种特殊的程序段,其执行只能一气呵成,不可被中断。原语是由关中断/开中断指令实现的。软件解决方案的主要问题是由“进入区的各种操作无法一气呵成”,因此如果能把进入区、退出区的操作都用“原语”实现,使这些操作能“一气呵成”就能避免问题。
1.整型信号量
用一个整数型的变量作为信号量,用来表示系统中某种资源的数量。wait(S)、signal(S)可描述为:
与普通整数变量的区别:对信号量的操作只有三种,即初始化、P操作、V操作
ait(S) 原语,“检查”和“上锁”一气呵成,避免了并发、异步导致的问题。以申请使用打印机举例:
存在的问题: 不满足 “让权等待” 原则,会发生 忙等。
2.记录型信号量
增加链表指针克服“忙等”
整型信号量存在“忙等”问题,因此人们又提出了“记录型信号量”,即用记录型数据结构表示的信号量。
除了需要用于代表资源数目的整型变量value外,再增加一个进程链表L,用于链接所有等待该资源的进程。
- wait:如果剩余资源数不够使用block原语使进程从运行态进入阻塞态,并把挂到信号量S的等待队列(即阻塞队列)中。
- signal:释放资源后,若还有别的进程在等待这种资源,则使用wakeup原语唤醒等待队列中的一个进程,该进程从阻塞态变为就绪态。
- S.value的初值表示系统中某种资源的数目。
- P操作:
- 对信号量S的一次P操作意味着进程请求一个单位的该资源,因此需要执行S.value-,表示资源数减1
- 当S.value<0时表示该类资源已分配完毕,因此进程应调用bock原语进行自我阻塞(当前运行的进程从运行态→阻塞态),主动放弃处理机,并插入该类资源的等待队列S.L中。
- 可见,该机制遵循了“让权等待”原则,不会出现“忙等”现象。
- V操作:
- 对信号量S的一次V操作意味进程释放一个单位的该资源,因此需要执行S.value.+,表示资源数加1,
- 若加1后仍是S.value<=0,表示依然有进程在等待该类资源,因此应调用wakeup原语唤醒等待队列中的第一个进程(被唤醒进程从阻塞态→就绪态)
3. AND型信号量(了解)
基本思路:将进程整个运行过程中需要的所有资源,一次性全部分配给进程,待进程使用完后全部释放。只要有一个资源尚未能分配,其他所有能分配的资源都不分配。
采用原子操作方式:要么把他请求的资源全部分配,要么一个也不分配。
4. 信号量机制实现互斥
伪代码如下所示:
设 S 为实现进程 P1、P2 互斥的信号量,由于只允许一个进程进入临界区,所以 S 的初值应设为 1。然后把临界区置于 P(S) 和 V(S) 之间,进入区之前申请资源(P操作),退出区之前释放资源( V操作 ),即可实现两个进程对临界资源的互斥访问。
操作:
- 1.分析并发进程的关键活动,划定临界区(如:对临界资源打印机的访问就应放在临界区)
- 2.设置互斥信号量mutex,初值为1
- 3.在进入区P(mutex)一一申请资源
- 4.在退出区V(mutex)一一释放资源
注意
- 对不同的临界资源需要设置不同的互斥信号量。
- P、V操作必须成对出现。缺少P(mutex)就不能保证临界资源的互斥访问。缺少V(mutex)会导致资源永不被释放,等待进程永不被唤醒。
5.信号量机制实现进程同步
进程同步要让各并发进程按要求有序地推进。
保证了代码4一定是在代码2之后执行。
步骤:先V后P,后V前P
- 1.分析什么地方需要实现“同步关系”,即必须保证“一前一后”执行的两个操作(或两句代码)
- 2.设置同步信号量S,初始为0
- 3.在==“前操作”之后==执行V(S)
- 4.在==“后操作”之前==执行P(S)
注意
- 若先执行到V(S)操作,则S+后S=1。之后当执行到P(S)操作时,由于S=1,表示有可用资源,会执行S-,S的值变回0,P2进程不会执行block原语,而是继续往下执行代码4。
- 若先执行到P(S)操作,由于S=0,S-后S=-1,表示此时没有可用资源,因此P操作中会执行bock原语,主动请求阻塞;当执行完代码2,继而执行V(S)操作,S+,使S变回0,由于此时有进程在该信号量对应的阻塞队列中,因此会在V操作中执行wakeup原语,唤醒P2进程。这样P2就可以继续执行代码4
6.信号量机制实现前驱关系
进程P1中有句代码S1,P2中有句代码S2 …P… P6中有句代码S6。这些代码要求按如下前驱图所示的顺序来执行:
其实每一对前驱关系都是一个进程同步问题(需要保证一前一后的操作),因此,
7.同步互斥信号量总结
4.5 管程机制(p121)
汉森(hansan)
霍尔 (hoare)
号量机制存在的问题 : 编写程序困难、易出错。 因此人们想设计一种机制,让程序员写程序时不需要再关注复杂的PV操作,让写代码更轻松。1973年,Brinch Hansen首次在程序设计语言(Pascal)中引入了“管程”成分――一种高级同步机制。
1.引入管程原因:
信号量机制是既方便又有效的同步机制,但每次要访问临界资源的进程必须自备同步操作wait(s)和signal(s) ,使大量的同步操作分散在各个进程中 ,不仅给系统带来了麻烦,而且还会因为同步机制使用不当造成系统死锁。 管程的引入让程序员写程序时不需要再关注复杂的PV操作,从而避免了传统信号量机制存在的很多问题。
2.管程的定义:由一组数据及定义在这组数据之上的对这组数据的操作组成的软件模块,这组操作能初始化并改变管程中的数据和同步进程。
3.管程的组成:
- 局部于管程的共享数据结构说明
- 对该数据结构进行操作的一组过程(函数)
- 对局部于管程的共享数据设置初始值的语句
- 管程的名字
管程是一种特殊的软件模块,有这些部分组成:
monitor Demo{//定义一个名称为"Demo"的管程
//定义共享数据结构,对应系统中的某种共享资源
共享数据结构 S;
//对共享数据结构初始化的语句
init_code(){
S=5; //初始资源数等于5
}
//过程1:申请一个资源
take_away(){
对共享数据结构x的一系列处理;
s--; //可用资源-1
...
}
//过程2:归还一个资源
give_back(){
对共享数据结构x的一系列处理;
s++; //可用资源+1
...
}
}
4.管程的特征:
- 局部于管程的数据只能被局部于管程的过程所访问 (类中变量有自己的作用范围)
- 一个进程只有通过调用管程内的过程才能进入管程访问共享数据(这种互斥特性是由编译器来实现的。)
- 每次仅允许一个进程在管程内执行某个内部过程
注:过程其实就是函数,如下面这个 People 类,People 是管程的名字,username 和 str 是局部于管程的共享数据结构,login 方法是该数据结构进行操作的过程。
public class People{ private String username = "admin"; // 用户名 private String str= "123456"; // 密码 public void login(){ if("admin".equals(username) && "123456".equals(str)){ System.out.println("登录成功!"); } } }
5.条件变量:
条件变量condition,是表示管程阻塞原因的变量。
通常,一个进程被阻塞的原因可以有多个,因此在管程中设置了多个条件变量。每个条件变量保存了一个等待队列,用于记录因该条件变量而阻塞的所有进程,对条件变量只能进行两种操作,即wait和signal。
- x.wait:当x对应的条件不满足时,正在调用管程的进程调用x.wait将自己插入x条件的等待队列,并释放管程。此时其他进程可以使用该管程。
- x.signal:x对应的条件发生了变化,则调用x.signal,唤醒一个因x条件而阻塞的进程。
monitor Demo{
共享数据结构 S;
condition x; //定义一个条件变量x
init_code(){...}
take_away(){
if(S<0) x.wait(); //资源不够,在条件变量x上阻塞等待
资源足够,分配资源,做一系列处理;
}
give_back(){
归还资源,做一系列相应处理;
if(有进程在等待)x.signal(); //唤醒一个阻塞进程
}
}
- 条件变量和信号量的比较:
- 相似点:条件变量的wait/signal操作类似于信号量的P/V操作,可以实现进程的阻塞/唤醒。
- 不同点:条件变量是“没有值”的,仅实现了“排队等待”功能;而信号量是“有值”的,信号量的值反映了剩余资源数,而在管程中,剩余资源数用共享数据结构记录。
注:实际上管程包含了面向对象的思想,将表征共享资源的数据结构以及对其数据结构操作的一组过程(包括同步机制),都集中分装在一个对象内部,隐藏实现细节。
管程和进程的区别:
4.6 经典进程同步问题
4.6.1 生产者-消费者问题
1.利用记录型信号量解决生产者-消费者问题
问题描述
系统中有一组生产者进程和一组消费者进程,生产者进程每次生产一个产品放入缓冲区,消费者进程每次从缓冲区中取出一个产品并使用。(注:这里的“产品”理解为某种数据)
生产者、消费者共享一个初始为空、大小为n的缓冲区。
-
只有缓冲区没满时,生产者才能把产品放入缓冲区,否则必须等待。
-
只有缓冲区不空时,消费者才能从中取出产品,否则必须等待。
-
缓冲区是临界资源,各进程必须互斥地访问。
问题分析
-
1.关系分析。找出题目中描述的各个进程,分析它们之间的同步、互斥关系。
同步关系:缓冲区没满,生产者生产;缓冲区没空,消费者消费。
互斥关系:各进程互斥访问缓冲区。
-
2.整理思路。根据各进程的操作流程确定P、V操作的大致顺序。
3.设置信号量。并根据题目条件确定信号量初值。(互斥信号量初值一般为1,同步信号量的初始值要看对应资源的初始值是多少)
semaphore mutex = 1; //互斥信号量,实现对缓冲区的互斥访问 semaphore empty = n; //同步信号量,表示空闲缓冲区的数量 semaphore full = 0; //同步信号量,表示产品的数量,也即非空缓冲区的数量
进程描述:
能否改变P、V操作顺序? 不能。不能,会发生死锁
若此时缓冲区内已经放满产品,则 empty=0,full=n。则生产者进程执行 ① 使mutex变为0,再执行②,由于已没有空闲缓冲区,因此生产者被阻塞。由于生产者阻塞,因此切换回消费者进程。消费者进程执行 ③,由于 mutex 为 0,即生产者还没释放对临界资源的 “锁”,因此消费者也被阻塞。生产者和消费者循环等待被对方唤醒,出现 死锁。
因此 实现互斥的 P 操作一定要在实现同步的 P 操作之后。
V 操作不会导致进程阻塞,因此 两个 V 操作顺序可以交换。
能否只设置一个同步信号量
不能。原因在于:两个信号量 empty 和 full,其中 empty 用于制约生产者生产,full 用于制约消费者消费。如果只设置一个信号量,如 full,那么生产者会无限的生产,起不到制约作用。
2.利用管程解决生产者消费者问题
见 p125
4.6.2哲学家进餐问题
戴克斯特拉(Dijkstra)提出的哲学家进餐问题是典型的同步问题。
问题描述:一张圆桌上坐着5名哲学家,每两个哲学家之间的桌上摆一根筷子,桌子的中间是一碗米饭。哲学家们倾注毕生的精力用于思考和进餐,哲学家在思考时,并不影响他人。只有当哲学家饥饿时,才试图拿起左、右两根筷子(一根一根地拿起)。如果筷子已在他人手上,则需等待。饥饿的哲学家只有同时拿起两根筷子才可以开始进餐,当进餐完毕后,放下筷子继续思考。
问题分析:
1.关系分析
系统中有5个哲学家进程,5位哲学家与左右邻居对其中间筷子的访问是互斥关系。
2.整理思路
哲学家进餐问题中 只有互斥关系,但与之前遇到的问题不同点在于,每个哲学家进程需要同时持有两个临界资源才能开始吃饭。如何避免临界资源分配不当造成的死锁现象,是哲学家问题的关键。
3.信号量的设置
定义互斥信号量数组 chopstick[5]={1,1,1,1,1} 用于实现对 5 个筷子的互斥访问。并对哲学家按0~4编号,哲学家 i 左边的筷子编号为 i,右边的筷子编号为 (i+1)%5。此外,还需要设置 互斥信号量mutex,用以保证哲学家进程左右两支筷子都可用。
进程描述
算法保证,一个哲学家再拿到筷子拿到一半时被阻塞,也不会有别的哲学家尝试拿筷子,即至少有一个哲学家进程不阻塞。
其他方案:
① 对哲学家进程施加一些限制条件,如最多允许四个哲学家同时进餐。这样可以保证至少有一个哲学家是可以拿到左右两只筷子的。
② 要求奇数号哲学家先拿左边的筷子,然后再拿右边的筷子,而偶数号哲学家刚好相反。用这种方法可以保证如果相邻的两个奇偶号哲学家都想吃饭,那么只会有其中一个可以拿起第一只筷子,另一个会直接阻塞。这就避免了占有一支后再等待另一只的情况。
4.6.3 读者-写者问题
问题描述
有读者和写者两组并发进程,共享一个文件,当两个或两个以上的读进程同时访问共享数据时不会产生副作用,但若某个写进程和其他进程(读进程或写进程)同时访问共享数据时则可能导致数据不一致的错误。因此要求:
- ①允许多个读者可以同时对文件执行读操作
- ②只允许一个写者往文件中写信息
- ③任一写者在完成写操作之前不允许其他读者或写者工作
- ④写者执行写操作前,应让已有的读者和写者全部退出
问题分析
- 两类进程:写进程、读进程
- 互斥关系:写进程一写进程、写进程一读进程。读进程与读进程不存在互斥问题
进程描述:
方案1
方案设置 rw 和 mutex 两个信号量。rw 信号量 用于实现 读进程与写进程、写进程与写进程 对共享文件的互斥访问。mutex 信号量 用于保证对 count 变量的互斥访问。
若没有设置 mutex 信号量,两个读进程并发执行到 if 条件且都满足,都会执行 P(rw),会造成其中一个读进程阻塞的情况。设置 mutex 信号量,使得 count 信号量的检查和赋值操作一气呵成,保证了对 count 信号量访问的互斥性。
方案 1 存在的问题: 只要有读进程还在读,写进程就要一直阻塞等待,可能 “饿死”。因此,这种算法中,读进程是优先的。
方案2
方案 2 是对方案 1 问题的修正,添加了 w 信号量,保证了 读写公平 。如:假设对共享文件的访问顺序是:读者1→读者2→ 写者1 → 读者3 ,读者 2 执行完后,写者 1 将会进行写文件,读者 3 进程将会被阻塞。待写者1写完文件后,读者 3 进行读写者 1 访问后的文件。
算法 核心思想 在于设置了一个 计数器 count 用来记录当前正在访问共享文件的读进程数。我们可以用 count 的值来判断当前进入的进程是否是第一个/最后一个读进程,从而做出不同的处理。另外,还需考虑 count 变量的互斥性。
在这种算法中,连续进入的多个读者可以同时读文件;写者和其他进程不能同时访问文件;写者不会饥饿,但也并不是真正的“写优先”,而是相对公平的先来先服务原则。
有的书上把这种算法称为“读写公平法”