前置
本篇是平衡树-treap的补充学习笔记。
Treap
- 树堆
学习基础:适合一定基础的:比如,实现了经典二叉搜索树(常用的几个函数写过), 和二叉堆(数组的上浮下沉会写吗?),至少了解旋转的概念且写过旋转的接口(有一定理解,比如实现AVL
树/红黑树
)(涉及到相关思想)。
实现语言:Java。 —其它语言的小伙伴可拷贝我的代码转译成自己的语言(笔者虽然多语言学习,但使用侧重点不同, 对语言的理解也浅薄, 频繁切换语言不妥。)
纯根据理解手写。
来源:算法导论---红黑树章节后的treap思考题
参考书籍:算法导论
- 有关问题:
- 算法导论第6章堆排序详细地说明了:二叉堆概念, 上浮和下沉操作的相关概念伪代码。实现一下二叉堆(优先级队列)
- 算法导论第12章介绍了
transplant
接口, 和二叉搜索树的其它好用的函数。 - 算法导论第13章介绍了红黑树, 红黑树的代码很难写且不易理解,只需了解一下旋转这个操作和伪代码即可。
- 可以去油管或者b站, 或者搜索引擎查找相关问题。
笔者水平有限, 本篇基于笔记改写, 缺点很多, 不太适合新手, 适合部分熟悉的朋友回顾复习, 在此见谅。
引入
- 对于一般的二叉搜索树, 已知n个数据序列插入到一个二叉搜索树有可能得到性能极差(高度极不平衡的二叉搜索树)。这种单支树的例子, 相信你已经不会陌生了。对于随机化构建的二叉搜索树, 经过概率论分析的数学期望, 得到的二叉搜索树是趋向平衡的。
之前写过一篇动态随机化的平衡树结构-----跳表, 非形式地讨论了这个问题。
接下来, 介绍另一种动态随机化的平衡树结构-----Treap
。
为什么有了随机化构建, 而依旧有研究动态化构建的必要呢? 尽管在跳表篇给了解释, 但此篇为不甚了解的朋友作出非严格地说明。已知n个数据构建随机二叉搜索树, 当然可行。 缺点? 如果我们未知数据量n呢?或者随机化二叉搜索树,我们还要动态地插入删除呢?, 在只允许我们一次取一个数据的场景, 经典的随机化构建二叉搜索树不现实了。 我都拿不到所有数据,如何随机化地插入二叉搜索树呢? 相比
Treap
和跳表
动态树结构, 经典随机二叉搜索树可以说是静态结构。
介绍
Treap
是一种弱平衡的树结构, 什么叫做弱平衡呢? 不同平衡树对平衡的定义不同, 确切的,它们对平衡的宏观定义是相同的(维持一棵好性能的树), 但对树的平衡严格程度要求是不一样的。
一般地, 弱平衡树更好实现, 相比于强平衡的AVL
(左右子树高度差不为1), 红黑树
(左右高度差小于2倍), 跳表明显好实现多了。其次,强平衡树在高度上有最坏的保证(最坏也是性能比较好的),弱平衡树最坏保证是经典二叉搜索树的最坏情况(单支链表的情况)。
归咎原因, 弱平衡没有在高度上严格保证, 这里的Treap
还把基本操作交给概率这一事物, 平均来看很好, 但失败的后果会很糟糕(虽然失败导致最坏的情况从概率数字来看几乎不可能发生)。
现在,我们可以正式地介绍一下Treap
了,
在此,简单回顾一下:
对于二叉搜索树: 基本性质: 左子树的key <= 根 <= 右子树的key。
对于二叉堆:基本性质:孩子的key>=父亲的key(最小堆), 兄弟之间的大小关系不在意。
综合二者性质,依旧让key的关系满足: 左 < 根 < 右, 可以取等自己调整一下。但我个人风格是key最好互异。
堆的性质从何体现, 我们引入了一个priority字段,表示优先级。
类比二叉堆的最小堆, 那么最小Treap
,满足parent.priority < node.priority
综合:
Treap
具有以下几个重要性质:
-
二叉搜索树性质:对于每个节点,其左子树的所有节点的键值小于该节点的键值,而右子树的所有节点的键值大于该节点的键值。假设键值是不一样的。
-
堆性质:每个节点的优先级大于或等于其子节点的优先级。这条性质导致这个结构和堆一致。
-
随机性:节点的优先级通常是随机生成器(如
Java
中的Random对象)生成的,这使得Treap
的结构在插入和删除操作中保持平均 O ( l o g n ) O(log n) O(logn) 的时间复杂度。 -
动态平衡性:支持随机化的动态插入,删除, 比随机化二叉搜索树自由。
实现
- 以下代码比较简单, 若你是学Java的应该不难读懂,其它语言的小伙伴可以借助
chatgpt
翻译成自己的语言,这是一种我比较经典的写法了。
import java.util.Random;
import java.util.Comparator;
public class Treap<K,V> {
//比较器, 可以手动传递比较器对象, 否则K必须实现Comparable接口
private Comparator<? super K> comparator;
//随机数生成器, 为每一个节点生成一个随机数
private final Random random = new Random();
private Node<K,V> root; //根节点
public class Node<K,V>{
K key; //键
V value; //值
Node<K,V> left; //左子树
Node<K,V> right; //右子树
Node<K,V> parent; //父指针
int priority; //优先级
public Node(K key, V value) {
this.key = key;
this.value = value;
left = right = parent = null;
priority = random.nextInt();//为新生成的节点分配一个随机数。
}
}
public Treap(){
this(null);
}
public Treap(Comparator<? super K> comparator) {
this.comparator = comparator;
}
}
查询操作
查询操作, 方法思路同经典二叉搜索树, 在此不多赘述。
- 下面实现了三个方法, 核心关注
search
方法,contains
返回一个布尔值,判断关键字key的节点是否存在。get
方法根据键获取值。
public Node<K,V> search(K key){
if(root == null){
return null; //这里单独检查一下。
}
Node<K,V> current = root;//遍历Treap
int cmp = 0; //记录比较结果
if(comparator != null){
//比较器不为空,那么优先使用比较器。
while(current!=null){
cmp = comparator.compare(current.key, key);
if(cmp==0){
return current;//找到了!直接返回节点的引用。
}
else if(cmp<0){
//当前值太小了, 前往右子树
current = current.right;
}
else{
//cmp>0
current = current.left;
}
}
}
else{
//comparator == null
@SuppressWarnings("unchecked!")
Comparable<? super K> comparable = (Comparable<? super K>)current.key;
// 使用者必须确保K类型是可比较的, 否则报错。
cmp = comparable.compareTo(key);
while(current != null){
comparable = (Comparable<? super K>)current.key;
cmp = comparable.compareTo(key);
//逻辑与比较器相同
if(cmp==0){
return current;
}
else if(cmp<0){
current = current.right;
}
else{
current = current.left;
}
}
}
return null;//出循环了即为空。
}
//根据serach结果造contains函数和get函数
public boolean contains(K key){
return search(key) != null;
}
public V get(K key){
return search(key) != null ? search(key).value : null;
}
插入操作
写法很简单, 套路更简单。
经典BST
插入+二叉堆的上浮调整。
TREAP-INSERT(T, x):
y <- T.root
p <- NIL
while y ≠ NIL:
p <- y
if y.key == x.key:
// Update the value
y.val <- x.val