文章目录
0. 前言
协作进程(cooperating process) 能与系统内的其他执行进程互相影响。协作进程或能直接共享逻辑地址空间(即代码和数据),或能通过文件或消息来共享数据。前一种线程可通过线程来实现,参考第4章,共享数据的访问可能导致数据都不一致。本章讨论多种机制,以便确保共享同一逻辑地址空间的协作进程的有序执行,从而维护数据的一致性。
本章目标:
- 引入临界区问题,它的解决问题可以用于确保共享数据的一致性。
- 讨论临界区问题的软件和硬件解决方案
- 分析进程同步的多个经典问题
- 讨论解决进程同步问题的多个工具
6.1 背景
互相协作的进程之间有共享的数据,于是这里就有一个并发情况下,如何确保有序操作这些数据、维护一致性的问题,即进程同步。
从底层到高级应用,同步机制依次有临界区、信号量、管、原程子事务。
多个进程并发访问和操作同一数据且执行结果与访问发生的特定顺序有关,称之为竞争条件(race condition)。
6.2 临界区(critical section)
每个进程有一个代码段(code segment)称为临界区(critical section),在该区中进程可能改变共同变量、更新一个表或写一个文件等。这种系统的重要特征是当一个进程进入临界区,没有其他进程可被允许在临界区内执行,即没有两个进程可同时在临界区内执行。
临界资源(Critical resource)每次只能被一个进程访问。而临界区则是能够访问临界资源的代码片段。
临界区问题(critical-section problem)是设计一个以便进程协作的协议。每个进程必须请求允许进入其临界区。实现请求的代码段称为进入区(entry section),临界区之后可有退出区(exit section),其他代码段成为剩余区(remainder section)。
一个典型进程Pi的通用结构:
do{
进入区
临界区
退出区
剩余区
}while(TRUE)
临界区问题的解答必须满足三项要求:
-
互斥(mutual exclusion): 如果进程Pi在其临界区内执行,那么其他进程都不能在其临界区内执行;
-
前进(progress): 如果没有进程在其临界区内执行且有进程需进入临界区,那么只有那么不在剩余区内执行的进程可参加选择,以确定谁能下一个进入临界区,且这种选择不能无限推迟;
-
有限等待(bounded waiting): 从一个进程做出进入临界区的请求,直到该请求允许为止,其他进程允许进入其临界区内的次数有上限。
一个操作系统,在某个时刻,可同时存在有多个处于内核模式的活动进程,因此实现操作系统的内核代码,会存在竞争条件。内核开发人员有必要确保其操作系统不会产生竞争条件。
有两种方法用于处理操作系统内的临界区问题:抢占内核(preemptive kernel)与非抢占内核(nonpreemptive kernel):
- 抢占内核允许处于内核模式的进程被抢占。
- 非抢占内核不允许内核模式的进程被抢占。
- 非抢占内核的内核数据结构从根本上不会导致竞争条件,对于抢占内核需要认真设计以确保其内核数据结构不会导致竞争条件。
- 但抢占内核更受欢迎,因为抢占内核更适合实时编程,因为它能允许实时进程抢占处于内核模式运行的其他进程。再者,抢占内核的响应更快,因为处于内核模式的进程在释放CPU之前不会运行过久。
6.3 Peterson算法
Peterson算法是一种经典的基于软件的临界区问题算法,可能现代计算机体系架构基本机器语言有些不同,不能确保正确运行。
Peterson算法适用于两个进程在临界区与剩余区间交替执行,为了方便,当使用Pi时,Pj来标示另一个进程,即j=i−1。Peterson算法需要在两个进程之间共享两个数据项:
int turn;
boolean flag[2];
变量turn表示哪个进程可以进入其临界区,即如果turn==i,那么进程Pi允许在其临界区内执行。
数组flag表示哪个进程想要进入临界区,如果flag[i]为true,即Pi想进入其临界区。
//进程Pi的Peterson算法
do{
flag[i]=TRUE;
turn=j;
while(flag[j]&&turn==j);
临界区
flag[i]=FALSE;
剩余区
}while(TRUE)
可以证明,满足三项要求。
Peterson算法实际上是一种谦让的过程,即:
Pi:我已经准备好了,但是我让这次一次的turn=j,看看Pj是否要运行,如果是的话,我就让Pj先运行。
Pj也是这样的情况。
6.4 硬件同步
通过要求临界区用锁来防护,就可以避免竞争条件,即一个进程在进入临界区之前必须得到锁,而其退出临界区时释放锁。
do{
请求锁
临界区
释放锁
剩余区
}while(TRUE)
硬件特性能简化编程任务且提高系统效率。
对于单处理器环境,临界区问题可简单地加以解决:在修改共享变量时要禁止中断出现。这样其他指令不可能执行,所以共享变量也不会被意外修改。这种方法通常为抢占式内核所采用。
在多处理器环境下,这种解决方法是不可行的,低效且影响系统时钟。
特殊硬件指令以允许能原子地(不可中断的)检查和修改字的内容或交换两个字的内容。如TestAndSet(),当两个指令同时执行在不同的CPU上,那么它们会按任意顺序来顺序执行。
TestAndSet指令定义:
boolean TestAndSet(boolean *target