在包含n个元素的无序集合中,寻找第i个顺序统计量的时间复杂度为O(n)。通过建立一种特定的结构,可以使得任意的顺序统计量都可以在O(lgn)的时间内找到。这就是下面会提到的基于红黑树的顺序统计树。
相比于基础的数据结构,顺序统计树增加了一个域size[x]。这个域包含以x为根的子树的节点数(包含x本身)。size域满足等式:
size[x] = size[left[x]] + size[right[x]] + 1
再根据红黑树的排序特性,我们就可以O(lgn)的时间内完成下面的操作。
顺序统计树如下图所示:
查找第i小的元素
实现OS-SELECT(x, i)返回以x为根的子树中包含第i小关键字的节点的指针。根据排序树的性质,我们知道左子树的键值要小于根节点的键值,右节点的键值要大于根节点,这相当于静态的顺序统计量的PARTITION已经完成。同时我们知道左右子树的大小,我们就可以确定在哪个分支进行接下来的查找。
OS-SELECT(x, i) 整个过程如下: