优先队列
一、什么是优先队列?
在实际应用中,以打印机为例,有的作业虽然排在后面,但很重要,需要优先打印,这种带有优先级的队列,叫做优先队列(priority queue)。
优先队列是允许至少下面两种操作的数据结构:
- insert(插入)
- deleteMin(删除最小者):找出、返回并删除优先队列中最小的元素。
优先队列的应用场景:操作系统、外部排序算法、贪婪算法……
二、优先队列的一些简单实现思路
- 思路一:使用链表,在表头以O(1)执行插入,删除时,先查找到最小值,然后删除,这需要O(N)时间。
- 思路二:使用链表,让链表始终处于排序状态,插入需要O(N)时间,删除最小则只需要O(1)时间。
- 思路三:使用二叉查找树。它对这两种操作的平均运行时间都是O(logn)。
三、二叉堆(binary heap)
堆数据结构是一种数组对象,它可以被视为一棵完全二叉树结构,所以堆也叫做二叉堆。
完全二叉树:若设二叉树的深度为h,除第 h 层外,其它各层 (1~h-1) 的结点数都达到最大个数,第 h 层所有的结点都连续集中在最左边,这就是完全二叉树。
二叉堆满足二个特性:
- 父结点的键值总是大于或等于(小于或等于)任何一个子节点的键值。
- 每个结点的左子树和右子树都是一个二叉堆(都是最大堆或最小堆)。
当父结点的键值总是大于或等于任何一个子节点的键值时为最大堆。当父结点的键值总是小于或等于 任何一个子节点的键值时为最小堆。
堆有两个性质:结构性和堆序性。
结构性质:
完全二叉树的性质:一颗高为h的完全二叉树有2h到2h+1-1个节点。这意味着完全二叉树的高是logN的向下取整,因此它是O(logN)的。
因为完全二叉树的严格规律性,所以可以用一个数组而不是链表来表示它。
对于数组中任一位置i上的元素,其左儿子在位置2i上,有儿子在左儿子后的单元(2i+1)中,他的父亲则在位置i/2向下取整的位置上。
堆序性质:
让操作快速执行的性质是堆序性质(heap-order property).由于我们想要找到最小的元素,那么为了更快得到,我们让最小元素始终位于堆顶。这就得到了堆序性质:
在一个堆中,对于每一个节点X,它的父亲节点的值小于它的值,根节点除外。
堆是一颗完全二叉树,但是由数组实现。