队列
什么是队列
先进者先出,这就是典型的队列。 队列和栈一样,也是一种操作受限的线性表数据结构
队列的操作
入队和出队
- 入队:放一个数据到队列尾部
- 出队:从队列头部取一个元素
队列的分类
顺序队列和链式队列
- 用数组实现的队列叫作顺序队列
- 用链表实现的队列叫作链式队列
队列的应用
循环队列、阻塞队列、并发队列
-
基于数组的实现方法
// 用数组实现的队列 public class ArrayQueue { // 数组:items,数组大小:n private String[] items; private int n = 0; // head 表示队头下标,tail 表示队尾下标 private int head = 0; private int tail = 0; // 申请一个大小为 capacity 的数组 public ArrayQueue(int capacity) { items = new String[capacity]; n = capacity; } // 入队操作,将 item 放入队尾 public boolean enqueue(String item) { // tail == n 表示队列末尾没有空间了 if (tail == n) { // tail ==n && head==0,表示整个队列都占满了 if (head == 0) return false; // 数据搬移 for (int i = head; i < tail; ++i) { items[i-head] = items[i]; } // 搬移完之后重新更新 head 和 tail tail -= head; head = 0; } items[tail] = item; ++tail; return true; } // 出队 public String dequeue() { // 如果 head == tail 表示队列为空 if (head == tail) return null; // 为了让其他语言的同学看的更加明确,把 -- 操作放到单独一行来写了 String ret = items[head]; ++head; return ret; } }
实现队列需要两个指针:head指针,指向对头;tail指针,指向队尾
结合图片,当a、b、c、d依次入队后,队列中的head指针指向下标为0的位置,tail指针指向下标为4的位置
当调用两次出队操作之后,队列中的head指针指向下标为2的位置,tail指针仍然指向下标为4的位置
当不断的进行入队、出队操作,head和tail会持续往后移动。当tail移动到最右边,即便数组中还有空闲空间,也无法往队列中添加数据了。这个时候就需要数据搬移。
当队列操作时,我们在出队的时候可以不用搬移数据,如果没有空闲空间了,我们只需要在入队时,集中触发一次搬移操作。
从代码中看,当队列中的tail指针移动到数组的最右边后,如果有新的数据入队,我们可以将head和tail之间的数据,整体搬移到数组0到tail-head的位置 -
基于链表的队列实现方法
基于链表实现,也需要两个指针:head指针和tail指针,他们分别指向链表的第一个结点和最后一个结点
入队时,tail->next = new_node; tail = tail->next;
出队时,head= head->next
循环队列
问题:
用数组实现队列的时候,在tail==n时,会有数据搬移操作,这样入队的操作性能会受到影响。如何避免数据搬移呢
循环队列是什么:
循环队列,顾名思义,长得像一个环。
循环队列注重点
循环队列队满的情况,tail指向的位置实际上是没有存储数据的。
所以,循环队列会浪费一个数组的存储空间
实现细节
图中这个队列的大小为8,当前head=4,tail=7.
- 当有一个新的元素a入队时,我们放入下标为7的位置。但这个时候,我们并不把tail更新为8,而是将其在环中后移以为,到下标为0的位置,
- 当再有一个元素b入队时,我们将b放入下标为0的位置,然后tail加1更新为1。
所以,在a,b依次入队之后循环队列中的元素就变成下面的样子
通过这样的方法,我们成功的避免了数据搬移操作
实现循环队列的关键:确认好队空和队满的判定条件
队满的条件分析:tail=3,head=4,n=8 所以总结规律:(3+1)%8 = 4
整合成公式就是 : (tail+1)%n = head
- 非循环队列:
- 队空条件 head == tail
- 队满条件 tail == n
- 循环队列
- 对空条件 head == tail
- 队满条件 (tail+1)%n = head
阻塞队列和并发队列
阻塞队列
阻塞队列其实就是在队列基础上增加了阻塞操作。
- 在队列为空的时候,从对头取数据就会被阻塞。因为此时还没有数据可取,直到队列中有了数据才能返回;
- 当队列已经满了,那么插入数据的操作就会被阻塞,直到队列中有空闲位置后再插入数据,然后再返回
这种基于阻塞队列实现的 生产者 - 消费者模型,可以有效的协调生产和消费的速度。当’生产者’生产数据的速度过快,'消费者’来不及消费时,存储数据的队列很快就会满了。这个时候,生产者就会堵塞等待,直到’消费者’消费了数据,'生产者’才会被唤醒继续生产。
基于阻塞队列,我们还可以通过协调生产者和消费者的个数,来提高数据的处理效率。
并发队列
问题:
在多线程情况下,会有多个线程同时操作队列,这个时候就会存在线程安全问题,那如何实现一个线程安全的队列呢?
什么是并发队列
线程安全的队列我们叫做并发队列
解决
- 最简单直接的实现方式是直接在enqueue()、dequeue()方法上加锁,但是锁颗粒大并发度会比较低,同一时刻仅允许一个存或者取操作
- 实际上基于数组的循环队列,利用CAS原子操作,可以实现高效的并发队列。
问题:
当我们向固定大小的线程池中请求一个线程时,如果线城池中没有空闲资源了,这个时候线程池如何处理这个请求? 是拒绝还是排队请求?各种处理策略又是怎么是实现的呢?
解决:
- 非阻塞的处理方式: 直接拒绝任务请求
- 阻塞的处理方式:将请求排队,等到有空闲线程时,去除排队的请求继续处理。那如何存储排队的请求呢?
我们都希望公平的处理每个排队的请求,先进者先服务,所以队列这种数据结构很适合存储排队请求。
队列有基于链表和基于数组两种实现方式。这两种实现方式对于排队请求有什么区别呢
- 基于链表的实现方式: 可以实现一个支持无限排队的无界队列,但是可能会导致过多的排队等待,请求处理的响应时间过长。所以针对响应时间比较敏感的系统,基于链表实现的无限排队的线程池是不合适的
- 基于数组的实现方式:队列的大小有限,所以线程池中排队的请求超过队列大小时,接下来的请求就会被拒绝,这种方式对响应时间敏感的系统来说,就相对更加合理。不过,设置一个合理的队列大小,也是非常有讲究的。队列太大导致等待的请求太多,队列太小会导致无法充分利用系统资源、发挥最大性能
对于大部分资源有限的场景,当没有空闲资源时,基本上都可以通过队列这种操作结构来实现请求排队
图片来自于王争