【操作系统】多线程的同步与互斥

竞争与协作
在单核 CPU 系统里,为了实现多个程序同时运行的假象,操作系统通常以时间片调度的方式,让每个进程执行每次执行一个时间片,时间片用完了,就切换下一个进程运行,由于这个时间片的时间很短,于是就造成了「并发」的现象。
另外,操作系统也为每个进程创建巨大、私有的虚拟内存的假象,这种地址空间的抽象让每个程序好像拥有自己的内存,而实际上操作系统在背后秘密地让多个地址空间「复用」物理内存或者磁盘。

如果一个程序只有一个执行流程,也代表它是单线程的。当然一个程序可以有多个执行流程,也就是所谓的多线程程序,线程是调度的基本单位,进程则是资源分配的基本单位。
所以,线程之间是可以共享进程的资源,比如代码段、堆空间、数据段、打开的文件等资源,但每个线程都有自己独立的栈空间

那么问题就来了,多个线程如果竞争共享资源,如果不采取有效的措施,则会造成共享数据的混乱。
做个小实验,创建两个线程,它们分别对共享变量 i 自增 1执行 1000 次,如下代码:
#include <iostream>
#include <thread>
using namespace std;
int i = 0; //共享数据
//线程函数:对共享变量 i 自增1 执行 1000 次
void test()
{
int num = 1000;
for(int n = 0; n < 1000; n++)
{
i = i + 1;
}
}
int main()
{
cout << "start all threads" << endl;
//创建线程
std::thread thread_test1(test);
std::thread thread_test2(test);
//等待线程执行完成
thread_test1.join();
thread_test2.join();
std::cout << "all threads joined." << endl;
std::cout << "now i is: " << i << endl;
return 0;
}
按理来说, i 变量最后的值应该是 2000 ,但很不幸,并不是每次都如此。我们对上面的程序执行一下,结果如下:
每次运行不但会产生错误,而且得到不同的结果。在计算机是不能容忍的,虽然是小概率出现的错误,但随着次数的增大,概率增大,同时即使小概率事件也是一定会发生的。
为什么会发展这种情况呢
为了理解为什么会发生这种情况,我们必须了解编译器为更新计数器 i
变量生成的代码序列,也就是要了解汇编指令的执⾏顺序。
在这个例子中,我们只是想给 i
加上数字 1,那么它对应的汇编指令执行过程是这样的:
可以发现,只是单纯给 i
加上数字1,在 CPU 运行的时候,实际上要执执行 3 条指令。
设想我们的线程 1 进入这个代码区域,它将 i
的值(假设此时是 50 )从内存加载到它的寄存器中,然后它向寄存器加 1,此时在寄存器中的 i
值是 51。
现在,一件不幸的事情发送了:时钟中断发生。因此,操作系统将当前正在运行的线程的状态保存到线程的线程控制块 TCB。
现在更糟的事情发生了,线程 2 被调度运行,并进入同一段代码。它也执行了第一条指令,从内存获取 i
值并将其放⼊到寄存器中,此时内存中 i 的值仍为 50,因此线程 2 寄存器中的 i
值也是 50。假设线程 2 执执行接下来的两条指令,将寄存器中的 i
值 + 1,然后将寄存器中的 i
值保存到内存中,于是此时全局变量 i
值是 51。
最后,又发生一次上下文切换,线程 1 恢复执行。还记得它已经执行了两条汇编指令,现在准备执行最后一条指令。回忆一下, 线程 1 寄存器中的 i
值是51,因此,执行最后一条指令后,将值保存到内存,全局变量 i
的值再次被设置为 51。
简单来说,增加 i (值为 50)的代码被运行两次,按理来说,最后的 i 值应该是 52,但是由于不可控的调度,导致最后 i 值却是 51。
针对上面线程 1 和线程 2 的执行过程,画了一张流程图,会更明确一些:

互斥的概念
上述展示的情况称为竞争条件(race condition
),当多线程相互竞争操作共享变量时,由于运气不好,即在执行过程中发生了上下文切换,我们得到了错误的结果,事实上,每次运行都可能得到不同的结果,因此输出的结果存在竞争条件(indeterminate
)。
由于多线程执行操作共享变量的这段代码可能会导致竞争状态,因此我们将此段代码称为临界区(critical section
),它是访问共享资源的代码片段,一定不能给多线程同时执行。
我们希望这段代码是互斥(mutualexclusion
)的,也就说保证一个线程在临界区执行时,其他线程应该被阻止进入临界区。说白了,就是这段代码执行过程中,最多只能出现一个线程。

另外,互斥也并不是只针对多线程。在多进程竞争共享资源的候,也同样是可以使用互斥的方式来避免资源竞争造成的资源混乱。
同步的概念
我们都知道在多线程里面,每个线程并不一定是顺序执行的,它们基本是以各自独立的、不可预知的速度向前推进,但有时候我们又希望多个线程能密切合作,以实现⼀个共同的任务。
例如线程 1 是负责读入数据的,而线程 2 是负责处理数据的,这两个线程是相互合作、相互依赖的。线程 2 在没有收到线程 1 的唤醒通知时,就会一直阻塞等待,当线程 1 读完数据需要把数据传给线程 2 时,线程 1 会唤醒线程 2,并把数据交给线程 2 处理。
所谓同步,就是并发进程/线程在一些关键点上可能需要互相等待与互通消息,这种相互制约的等待与互通信息称为进程/线程同步。
举个生活的同步例子,肚子饿了想要吃饭,叫妈妈早点做菜,妈妈听到后就开始做菜,但是在妈妈没有做完饭之前,必须阻塞等待,等妈妈做完饭后,自然会通知你,接着吃饭的事情就可以进行了。

注意,同步与互斥是两种不同的概念:
- 同步:「操作 A 应在操作 B 之前执行」,「操作 C 必须在操作 A 和操作 B 都完成之后才能执行」等;
- 互斥:「操作 A 和操作 B 不能在同一时刻执行」
同步与互斥的实现和使用
为了实现进程/线程间正确的协作,操作系统必须提供实现进程协作的措施和方法,主要的方法有两种:
- 锁:加锁、解锁操作
- 信号量:P、V操作
这两个都可以⽅方便地实现进程/线程互斥,而信号量比锁的功能更强一些,它还可以方便地实现进程/线程同步。
锁
使用加锁操作和解锁操作可以解决并发线程/进程的互斥问题。
任何想进入临界区的线程,必须先执行加锁操作。若加锁操作顺利通过,则线程可进入临界区;在完成对临界资源的访问后再执行解锁操作,以释放该临界资源。

根据锁的实现不同,可以分为「忙等待锁」和「无忙等待锁」。
忙等待锁
现代 CPU 体系结构提供的特殊原子操作指令 —— 测试和置位(Test-and-Set
)指令。
用 C 代码表示 Test-and-Set 指令,形式如下:
int test_and_set(int* old_ptr, int new_data)
{
int old = *old_ptr;
*old_ptr = new_data;
return old;
}
测试并设置指令做了下述事情:
- 把
old_ptr
更新为new_data
的新值 - 返回
old_ptr
的旧值;
当然,关键是这些代码是原子执行。因为既可以测试旧值,又可以设置新值,所以我们把这条指令叫作「测试并设置」。
那什么是原子操作呢?原子操作就是要么全部执行,要么都不执行,不能出现执行到一半的中间状态
我们可以运用 Test-and-Set 指令来实现「忙等待锁」,代码如下:
//定义锁类型
typedef struct lock_t
{
int flag;
}lock_t;
//初始化
void init(lock_t *lock)
{
lock->flag = 0;
}
//获取锁
void lock(lock_t *lock)
{
while (TestAndSet(&lock->flag, 1) == 1)
{
; //dothing
}
}
//解锁
void unlock(lock_t *lock)
{
lock->flag = 0;
}
- 第一个场景是,首先假设一个线程在运行,调用
lock()
,没有其他线程持有锁,所以flag
是 0。当调用TestAndSet(flag, 1)
方法,返回 0,线程会跳出 while 循环,获取锁。同时也会原⼦的设置 flag为1,标志锁已经被持有。当线程离开临界区,调用unlock()
将flag
清理为 0。 - 第二种场景是,当某⼀个线程已经持有锁(即
flag
为1)。本线程调用lock()
,然后调用TestAndSet(flag, 1)
,这一次返回 1。只要另一个线程一直持有锁,TestAndSet()
会重复返回 1,本线程会一直忙等。当flag
终于被改为 0,本线程会调用 TestAndSet() ,返回 0 并且原子地设置为 1,从而获得锁,进入临界区。
很明显,当获取不到锁时,线程就会一直 while 循环,不做任何事情,所以就被称为「忙等待锁」,也被称为自旋锁(spin lock
)。
这是最简单的一种锁,一直自旋,利用 CPU周期,直到锁可用。在单处理器上,需要抢占式的调度器(即不断通过时钟中断一个线程,运行其他线程)。否则,自旋锁在单 CPU 上无法使用,因为一个自旋的线程永远不会放弃 CPU。
无忙等待锁
无等待锁顾明思议就是获取不到锁的时候,不用自旋。
既然不想自旋,那当没获取到锁的时候,就把当前线程放入到锁的等待队列,然后执行调度程序,把 CPU 让给其他线程执行。
typedef struct lock_t
{
int flag;
queue_t *q; //等待队列
}lock_t;
//初始化
void init(lock_t *lock)
{
lock->flag = 0;
queue_init(lock->q);
}
//获取锁
void lock(lock_t *lock)
{
while (TestAndSet(&lock->flag, 1) == 1)
{
保存现在运行线程 TCB;
将现在运行的线程 TCB 插入到等待队列;
设置该线程为等待状态;
调度程序;
}
}
//解锁
void unlock(lock_t *lock)
{`在这里插入代码片`
if(lock->q != NULL)
{
移出等待队列的队头元素;
将该线程的 TCB 插入到就绪队列;
设置该线程为就绪状态;
}
lock->flag = 0;
}
本次只是提出了两种简单锁的实现方式。当然,在具体操作系统实现中,会更复杂,但也离不开本例子两个基本元素。
信号量
PV操作
信号量是操作系统提供的⼀种协调共享资源访问的方法
通常信号量表示资源的数量,对应的变量是⼀个整型(sem
)变量。
另外,还有两个原子操作的系统调用函数来控制信号量的,分别是:
-
P 操作 :将
sem
减1
,相减后,如果sem < 0
,则进程/线程进⼊阻塞等待,否则继续,表明 P操作可能会阻塞; -
V 操作 :将
sem
加1
,相加后,如果sem <= 0
,唤醒一个等待中的进程/线程,表明 V 操作不会阻塞
P 操作是用在进⼊临界区之前,V 操作是用在离开临界区之后,这两个操作是必须成对出现的。
举个类比,2 个资源的信号量,相当于 2 条火车轨道,PV 操作如下图过程:

PV操作的实现
信号量数据结构与 PV 操作的算法描述如下代码所示:
typedef struct sem_t
{
int flag; //资源个数
queue_t *q; //等待队列
}sem_t;
//初始化信号量
void init(sem_t *s, int sem)
{
s->sem = sem;
queue_init(s->q);
}
//P 操作
void P(sem_t *s)
{
s->sem--;
if(s->sem < 0)
{
1. 保留调用线程 CPU 现场;
2. 将该线程的 TCB 插入到 s 的等待队列;
3. 设置该线程为等待线程;
4. 执行调度程序;
}
}
//V 操作
void V(sem_t *s)
{
s->sem++;
if(s->sem <= 0)
{
1. 移出 s 等待队列首元素;
2. 将该线程的 TCB 插入就绪队列
3. 设置该线程为 [就绪] 状态;
}
}
PV 操作的函数是由操作系统管理和实现的,所以操作系统已经使得执执行PV 函数时是具有原子性的。
PV操作的互斥访问
为每类共享资源设置一个信号量 s
,其初值为 1
,表示该临界资源未被占用。
只要把进入临界区的操作置于 P(s)
和 V(s)
之间,即可实现进程 / 线程互斥:

此时,任何想进入临界区的线程,必先在互斥信号量上执行P操作,在完成对临界资源的访问后再执行V操作。由于互斥信号量的初始值为 1,故在第一个线程执行P操作后s值变为 0,表示临界资源为空闲,可分配给该线程,使之进入临界区。
若此时又有第二个线程想进入临界区,也应先执行P操作,结果使s变为负值,这就意味着临界资源已被占用,因此,第二个线程被阻塞。
并且,直到第一个线程执行V操作,释放临界资源而恢复s值为0后,才唤醒第二个线程,使之进入临界区,待它完成临界资源的访问后,又执行V操作,使s恢复到初始值1。
对于两个并发线程,互斥信号量的值仅取1、0 和 -1 三个值,分别表示:
- 如果互斥信号量为 1,表示没有线程进入临界区;
- 如果互斥信号量为 0,表示有一个线程进入临界区;
- 如果互斥信号量为 -1,表示一个线程进入临界区,另一个线程等待进入。
通过互斥信号量的方式,就能保证临界区任何时刻只有一个线程在执行,就达到了互斥的效果。
信号量实现事件同步
同步的方式是设置一个信号量,其初值为0
把前面的「吃饭-做饭」同步的例子,用代码的方式实现一下:
semaphore s1 = 0; //表示不需要吃饭
semaphore s2 = 0; //表示饭还没做完
//儿子线程
void son()
{
while(1)
{
肚子饿;
V(s1); // 叫妈妈做饭
P(s2); // 等待妈妈做完饭
}
}
//妈妈线程
void mon()
{
while (1)
{
P(s1); // 询问要不要吃饭
做饭;
V(s2); // 做完饭, 通知儿子干饭
}
}
(1)妈妈一开始询问儿子要不要做饭时,执行的是 P(s1)
,相当于询问儿子需不需要吃饭,由于 s1
初始值为 0,此时 s1
变成 -1,表明儿子不需要吃饭,所以妈妈线程就进入等待状态。
(2)当儿子肚子饿时,执行了 V(s1)
,使得 s1
信号量从 -1 变成 0,表明此时儿子需要吃饭了,于是就唤醒了阻塞中的妈妈线程,妈妈线程就开始做饭。
(3)接着,儿子线程执行了 P(s2)
,相当于询问妈妈饭做完了吗,由于s2
初始值是 0,则此时 s2
变成-1,说明妈妈还没做完饭,儿子线程就等待状态
(4)最后,妈妈终于做完饭了,于是执行V(s2)
,s2
信号量从 -1 变回了 0,于是就唤醒等待中的儿子线程,唤醒后,儿子线程就可以进行吃饭了
生产者—消费者问题

生产者—消费者问题描述:
- 生产者在生产数据后放在一个缓冲区中;
- 消费者从缓冲区取出数据处理;
- 任何时刻,只能有一个生产者或者消费者可以访问缓冲区
对问题分析:
- 任何时刻只能有一个线程操作缓冲区,说明操作缓冲区是临界代码,需要互斥
- 缓冲区空时,消费者必须等待生产者生成数据;缓冲区满时,生产者必须等待消费者取出数据。说明生产者和消费者需要同步
那么我们需要三个信号量,分别是:
- 互斥信号量
muetx
:用于互斥访问缓冲区,初始值为1; - 资源信号量
fullBuffer
:用于消费者询问缓冲区是否有数据,有数据则读取数据,初始化值为 0(表明缓冲区一开始为空) - 资源信号量
emptyBuffers
:用于生产者询问缓冲区是否有空位,有空位则生成数据,初始化值为 n(缓冲区大小);
具体实现的代码:
#define N 100
semaphore mutex = 1; // 互斥信号量 用于临界区的互斥访问
semaphore fullBuffer = 0; // 表示缓冲区 [满槽] 的个数
semaphore emptyBuffer = N; // 表示缓冲区 [空槽] 的个数
//生产者线程
void product(void)
{
while (1)
{
P(emptyBuffer); // 将空槽的个数 -1
P(mutex); // 进入临界区
将生产的数据放到缓冲区中;
V(mutex); // 离开临界区
V(fullBuffer); // 将满槽的个数 +1
}
}
//消费者线程
void consumer(void)
{
while (1)
{
P(fullBuffer); // 将满槽的个数 -1
P(mutex); // 进入临界区
从缓冲区读取数据;
V(mutex); // 离开临界区
V(emptyBuffer); // 将空槽的个数 +1
}
}
如果消费者线程一开始执行 P(fullBuffers)
,由于信号量 fullBufers
初始值为 0、则此时 fullBuffers
的值从 0变为 -1,说明缓冲区里没有数据,消费者只能等待。
接着,轮到生产者执行 P(emptyBuffers)
,表示减少1个空槽,如果当前没有其他生产者线程在临界区执行代码,那么该生产者线程就可以把数据放到缓冲区,放完后,执行V(fullBuffers)
,信号量 fulBufers
从 -1 变成 0,表明有「消费者」线程正在阻塞等待数据,于是阻塞等待的消费者线程会被唤醒。
消费者线程被唤醒后,如果此时没有其他消费者线程在读数据,那么就可以直接进入临界区,从缓冲区读取数据。最后,离开临界区后,把空槽的个数+1。
经典同步问题
哲学家就餐问题

哲学家就餐的问题描述:
-
5
个老大哥哲学家,闲着没事做,围绕着一张圆桌吃面; -
巧就巧在,这个桌子只有
5
支叉子,每两个哲学家之间放一支叉子;哲学家围在一起先思考,思考中途饿了就会想进餐; -
奇葩的是,这些哲学家要两支叉子才愿意吃面,也就是需要拿到左右两边的又子才进餐;
-
吃完后,会把两支叉子放回原处,继续思考;
那么问题来了,如何保证哲学家们的动作有序进行,而不会出现有人永远拿不到又子呢?
方案一
用信号量的方式,也就是 PV 操作来尝试解决,代码如下:
#define N 5 // 哲学家个数
semaphore fork[5]; // 信号量初始值为 1
void smart_person(int i) // i 为哲学家编号 0-4
{
while (1)
{
think(); //哲学家思考
P(fork[i]); //拿左边的叉子
P(fork[(1 + 1) % N]); //拿右边的叉子
eat(); //进餐
V(fork[i]); //放左边的叉子
V(fork[(1 + 1) % N]); //放右边的叉子
}
}
上述程序,好似很自然。拿起叉子用 P 操作,代表有叉子就直接用,没有叉子时就等待其他哲学家放叉子,但这种方法会造成死锁问题:所有人同时拿了左边的叉子。

不过,这种解法存在一个极端的问题:假设五位哲学家同时拿起左边的又子,桌面上就没有叉子了这样就没有人能够拿到他们右边的又子,也就说每一位哲学家都会在 P(fork[(i+1)% N]) 这条语句阻塞了,很明显这发生了死锁的现象。
方案二
既然「方案一」会发生同时竞争左边叉子导致死锁的现象,那么我们就在拿叉子前,加个互斥信号量,代码如下:
#define N 5 // 哲学家个数
semaphore fork[5]; // 信号量初始值为 1
semaphore mutex = 1; // 互斥信号量 初值为 1
void smart_person(int i) // i 为哲学家编号 0-4
{
while (1)
{
think(); //哲学家思考
P(mutex); //进入临界区
P(fork[i]); //拿左边的叉子
P(fork[(1 + 1) % N]); //拿右边的叉子
eat(); //进餐
V(fork[i]); //放左边的叉子
V(fork[(1 + 1) % N]); //放右边的叉子
V(mutex); //退出临界区
}
}
上面程序中的互斥信号量的作用就在于,只要有一个哲学家进入了「临界区」,也就是准备要拿叉子时,其他哲学家都不能动,只有这位哲学家用完叉子了,才能轮到下一个哲学家进餐。
方案二虽然能让哲学家们按顺序吃饭,但是每次进餐只能有一位哲学家,而桌面上是有5把叉子,按道理是能可以有两个哲学家同时进餐的,所以从效率角度上,这不是最好的解决方案。
方案三
- 既然方案二使用互斥信号量,会导致只能允许一个哲学家就餐,那么我们就不用它
- 另外,方案一的问题在于,会出现所有哲学家同时拿左边刀叉的可能性,那我们就避免哲学家可以同时拿左边的刀叉,采用分支结构,根据哲学家的编号的不同,而采取不同的动作。
即让偶数编号的哲学家「先拿左边的又子后拿右边的又子」,奇数编号的哲学家「先拿右边的又子后拿左边的又子」。
#define N 5 // 哲学家个数
semaphore fork[5]; // 信号量初始值为 1
void smart_person(int i) // i 为哲学家编号 0-4
{
while (1)
{
think(); //哲学家思考
if(i % 2 == 0) //偶数 先左后右
{
P(fork[i]); //拿左边的叉子
P(fork[(1 + 1) % N]); //拿右边的叉子
}
else //奇数 先右后左
{
P(fork[(1 + 1) % N]); //拿右边的叉子
P(fork[i]); //拿左边的叉子
}
eat(); //进餐
V(fork[i]); //放左边的叉子
V(fork[(1 + 1) % N]); //放右边的叉子
}
}
上面的程序,在P操作时,根据哲学家的编号不同,拿起左右两边叉子的顺序不同。另外,V操作是不需要分支的,因为V操作是不会阻塞的。

方案三即不会出现死锁,也可以两人同时进餐。
方案四
这里再提出另外一种可行的解决方案,我们用一个数组 state 来记录每一位哲学家在进食、思考还是饥饿状态(正在试图拿叉子)。
那么,一个哲学家只有在两个邻居都没有进餐时,才可以进入进餐状态。
第 i
个哲学家的左邻右舍,则由宏 LEFT
和 RIGHT
定义:
- LEFT:
(i + 5 - 1)% 5
- RIGHT:
(i + 1)% 5
比如 i
为2,则 LEFT
为1,RIGHT
为 3
具体代码实现如下:
#define N 5 // 哲学家个数
#define LEFT (i + N - 1) % N // i 左边的邻居编号
#define RIGHT (i + 1) % N // i 右边的邻居编号
#define THINKING 0 // 思考状态
#define HUNGRY 1 // 饥饿状态
#define EATING 2 // 进餐状态
int state[N]; // 数组记录每个哲学家的状态
semaphore s[5]; // 每一个哲学家一个信号量, 初始值为 0
semaphore mutex; // 互斥信号量,初值为1
void test(int i) // i 为哲学家编号 0-4
{
// 如果 i 号的左边两边哲学家毒不死进餐状态,把 i 号哲学家标记为进餐状态
if( state[i] == HUNGRY &&
state[LEFT] != EATING &&
state[RIGHT] != EATING )
{
state[i] = EATING; // 两把叉子到手
V(s[i]); // 通知第 i 个哲学家可以进餐了
}
}
// 功能: 要么拿到两把叉子,要么被阻塞起来
void take_forks(int i) // i 为哲学家编号 0-4
{
P(mutex); // 进入临界区
state[i] = HUNGRY; // 标记哲学家处于饥饿状态
test(i); // 尝试获取 2 支叉子
V(mutex); // 离开临界区
P(s[i]); // 没有叉子则阻塞,有叉子则继续正常运行
}
// 功能: 把两把叉子放回原处, 并在需要的时候,去唤醒左邻右舍
void put_froks(int i) // i 为哲学家编号 0-4
{
P(mutex); // 进入临界区
state[i] = THINKING; // 吃完饭了,交出叉子,标记为思考状态
test(LEFT); // 检查左边的人是否在进餐,没则唤醒
test(RIGHT); // 检查右边的人是否在进餐,没则唤醒
V(mutex); // 离开临界区
}
void smart_person(int i) // i 为哲学家编号 0-4
{
while (1)
{
think(); // 思考
take_forks(i); // 准备去拿叉子吃饭
eat(); // 吃饭
put_froks(i); // 放回叉子
}
}
上面的程序使用了一个信号量数组,每个信号量对应一位哲学家,这样在所需的又子被占用时,想进餐的哲学家就被阻塞。
注意,每个进程 / 线程将smart_person
函数作为主代码运行,而其他take_forks
、put_forks
和只是普通的函数,和test
只是普通的函数,而非单独的进程/线程。
方案四同样不会出现死锁,也可以两人同时进餐。
读者-写者问题
读者只会读取数据,不会修改数据,而写者即可以读也可以修改数据。
读者-写者的问题描述:
- 读 - 读 允许:同一时刻,允许多个读者同时读
- 读 - 写 互斥:没有写者时读者才能读,没有读者时写者才能写
- 写- 写 互斥:没有其他写者时,写者才能写
方案一
使用信号量的方式来尝试解决:
- 信号量
writeMutex
:控制写操作(读写,写写)的互斥信号量,初始值为1; - 读者记数
rCount
:记录正在读操作的读者个数,初始值为0; - 信号量
rCountMutex
:保护读者计数器的互斥修改,初始值为1;
代码实现:
semaphore writeMutex = 1; //控制写操作(读写,写写)的互斥信号量,初始值为1;
int rCount = 0; //记录正在读操作的读者个数,初始值为0;
semaphore rCountMutex = 1; //保护读者计数器的互斥修改,初始值为1;
void writer()
{
while (1)
{
P(writeMutex); // 进入临界区
write();
V(writeMutex); // 退出临界区
}
}
void reader()
{
while (1)
{
P(rCountMutex); //计数保护
if(rCount == 0) //第一个读者
P(writeMutex); //进入临界区
rCount++;
V(rCountMutex); //结束计数保护
read();
P(rCountMutex); //计数保护
rCount--
if(rCount == 0) //最后一个读者
V(writeMutex); // 退出临界区
V(rCountMutex); //结束计数保护
}
}
上面的这种实现,是读者优先策略,因为只要有读者正在读的状态,后来的读者都可以直接进入,如果
读者持续不断进入,则写者会处于饥饿状态。
方案二
那既然有读者优先策略,自然也有写者优先策略:
- 只要有写者准备要写入,写者应尽快执行写操作,后来的读者就必须阻塞;
- 如果有写者持续不断写入,则读者就处于饥饿;
在方案一的基础上新增如下变量:
- 信号量
readMutex
:控制读者进入的互斥信号量,初始值为1; - 信号量
writeMutex
:控制写者写操作的互斥信号量,初始值为1; - 读者记数
wCount
:记录写者数量,初始值为0; - 写者记数
rCount
: 记录写者数量,初始值为0; - 信号量
wCountMutex
:控制 wCount 互斥修改,初始值为1; - 信号量
rCountMutex
:控制 rCount 互斥修改,初始值为1;
semaphore readMutex = 1; //控制读者进入的互斥信号量,初始值为 1
semaphore writeMutex = 1; //控制写者写操作的互斥信号量,初始值为 1
int wCount = 0; //记录写者数量,初始值为 0
int rCount = 0; //记录读者数量,初始值为 0
semaphore wCountMutex = 1; //控制 wCount 互斥修改,初始值为1
semaphore rCountMutex = 1; //控制 rCount 互斥修改,初始值为1
//写者进程/线程执行函数
void writer(void)
{
while (1)
{
P(wCountMutex); // 进入临界区
if(wCount == 0)
P(readMutex); // 第一个写者进入 如果有读者则阻塞
wCount++;
V(wCountMutex); // 离开临界区
P(writeMutex); // 写者写操作之间互斥 进入临界区
write();
V(writeMutex); // 离开临界区
P(wCountMutex); // 进入临界区
wCount--; // 写完数据 准备离开
if(wCount == 0)
V(readMutex); // 最后一个读者离开了,则唤醒写者
V(wCountMutex); // 离开临界区
}
}
//读者进程/线程执行函数
void reader(void)
{
P(readMutex); // 控制读 进入临界区
P(rCountMutex); // 进入临界区
if(rCount == 0)
P(writeMutex); // 第一个读者进入,如果有写者则阻塞写者操作
V(rCountMutex); // 进入临界区
V(readMutex);
P(readMutex); // 进入临界区
read(); // 读数据
P(readMutex); // 离开临界区
P(rCountMutex); // 进入临界区
rCount--;
if(rCount == 0)
V(writeMutex); // 没有读者了 则唤醒阻塞中的写者的操作
V(rCountMutex); // 离开临界区
}
注意,这里 readMutex
的作用,开始有多个读者读数据,它们全部进入读者队列,此时来了一个写者,执行了P(readMutex)
之后,后续的读者由于阻塞在readMutex
上,都不能再进入读者队列,而写者到来,则可以全部进入写者队列,因此保证了写者优先。
同时,第一个写者执行了 P(rMutex)
之后,也不能马上开始写,必须等到所有进入读者队列的读者都执行完读操作,通过 V(writeMutex)
唤醒写者的写操作。
方案三
既然读者优先策略和写者优先策略都会造成饥饿的现象,那么我们就来实现一下公平策略:
公平策略:
- 优先级相同;
- 写者、读者互斥访问;
- 只能一个写者访问临界区;
- 可以有多个读者同时访问临街资源
int rCount = 0; // 正在进行读操作的读者个数,初始化为0
semaphore rCountMutex = 1; // 控制对读者个数rCount的互斥修改,初始化为 1
semaphore writeMutex = 1; // 控制写者写操作的互斥信号量 初始值 为 1
semaphore flag = 1; // 用于实现公平竞争 初始值为 1
//写者
void writer()
{
while (1)
{
P(flag); // 读写互斥 进入临界区
P(writeMutex); // 写者写操作互斥 进入临界区
write(); // 写数据
V(writeMutex); // 离开临界区
V(flag); // 离开临界区
}
}
//读者
void reader()
{
while (1)
{
P(flag); // 读写互斥 进入临界区
P(rCountMutex); // 进入临界区
if(rCount == 0)
P(writeMutex); // 当第一个读者进去 如果有写者则阻塞写者写操作
rCount++;
V(rCountMutex); // 离开临界区
V(flag); // 离开临界区
read(); // 读取数据
P(rCountMutex); // 进入临界区
rCount--;
if(rCount == 0)
V(writeMutex); // 当没有读者了,则唤醒阻塞中写者的操作
V(rCountMutex); // 离开临界区
}
}
看完代码不知你是否有这样的疑问,为什么加了一个信号量 flag
,就实现了公平竞争?
对比方案一的读者优先策略,可以发现,读者优先中只要后续有读者到达,读者就可以进入读者队列,而写者必须等待,直到没有读者到达。
没有读者到达会导致读者队列为空,即 rCount==0
,此时写者才可以进入临界区执行写操作
而这里 flag
的作用就是阻止读者的这种特殊权限(特殊权限是只要读者到达,就可以进入读者队列)
比如:开始来了一些读者读数据,它们全部进入读者队列,此时来了一个写者,执行 P(flag)
操作,使得后续到来的读者都阻塞在 flag
上,不能进入读者队列,这会使得读者队列逐渐为空,即 rCount
减为 0
这个写者也不能立马开始写(因为此时读者队列不为空),会阻塞在信号量 writeMutex
上,读者队列中的读者全部读取结束后,最后一个读者进程执行 V(writeMutex)
,唤醒刚才的写者,写者则继续开始进行写操作。