本文是手撕环形队列系列的第二篇,之前的文章链接如下:
《手撕环形队列》
前面文章介绍的是一个比较基本的环形队列,能够在多线程中使用,但有一个前提:
任意时刻,生产者和消费者最多都只能有一个。
也就是说,如果有多个生产者要并发向队列中写入,需要在外部进行加锁或其它方式的并发控制,保证任意时刻最多只有一个生产者真正向环形队列进行写入。同样的,多个消费者要从队列中读取进行消费,也需要在外部进行加锁或其它方式的并发控制,保证任意时刻最多只有一个消费者从环形队列进行读取。
本文的内容,就是介绍如何能够支持多线程场景下,多生产者并发写入、多消费者并发读取,完全由环形队列内部来解决,无需外部做任何额外的控制。并且,使用无锁的技术来实现,从而避免加锁解锁这种重操作对性能的影响。
无锁数据结构中,主要的技术实现手段是使用cpu的原子指令。介绍原子指令之前,先介绍一下没有原子指令的情况下会有什么问题。
通常我们在程序源码中写的语句,编译为二进制后,代码中的一行文本语句会变成二进制的多条汇编指令,因此这一行文本语句cpu执行时就不是原子的。多行文本语句,就更不是原子的了。多线程并发执行这些文本语句时,对应的多行汇编语句会在多个cpu 核上同时执行,无法保证他们之间的执行先后顺序关系。在多线程同时读写一个共享数据时,会发生各种误判,导致错误的结果。
以环形队列为例,来说明这个问题:
环形队列为初始状态,队列为空。两个生产者线程都要向队列进行写入,都调用 ring_queue_push()方法。这个方法的函数实现中,producer1 线程读取tail 为0,producer2 线程也读取到tail为0。然后producer1 向位置0写入数据,然后把tail 增1,tail变为1。
producer2 也向位置0写入数据,然后把tail 增1. tai增加1的过程:
tail = tail + 1;
由于pro