文章目录
一.红黑树的概念
红黑树是一颗二叉搜索树,他的每个节点增加一个储存位来表示节点的颜色,可以是红色或者黑色。通过对任何一条从根到叶子的路径上的各个节点的颜色进行约束,红黑树确保没有一条路径会比其他路径长出2倍,因而是接近平衡的。
1.红黑树的规则
(1)每个节点不是红色就是黑色。
(2)根节点是黑色的。
(3)如果一个节点是红色的,则它的两个孩子节点必须是黑色的,任意一条路径不会有连续的红色节点。
(4)对于任意一个节点,该节点到其所有NULL节点的简单路径上,均包含相同数量的黑色节点。
2.红黑树如何确保最长路径不超过最短路径的二倍?
(1)从根到NULL节点的每条路径都有相同数量的黑色节点,所以极端场景下,最短路径就是全是黑色节点的路径,假设最短路径长度为bh。
(2)任意一条路径不会有连续的红色节点,所以极端场景下,最长的路径就是一黑一红间隔组成,那么最长路径的长度为2*bh。
(3)理论上的全黑最短路径和一黑一红的最长路径并不是在每棵红黑树都存在。假设任意一条从根到NULL节点路径的长度为x,那bh <= x <= 2bh。
3.红黑树的效率
假设N是红黑树树中的节点数量,h最短路径的长度,那么2h - 1 <= N < 22*h - 1,因此 h ≈ logN,也就是意味着红黑树增删查改最坏也就是走最长路径 2*logN,时间复杂度还是O(logN)。
二.红黑树的实现
1.红黑树的结构
// 枚举值表示颜色
enum Colour
{
RED,
BLACK
};
// 这⾥我们默认按key/value结构实现
template<class K, class V>
struct RBTreeNode
{
// 这⾥更新控制平衡也要加入parent指针
pair<K, V> _kv;
RBTreeNode<K, V>* _left;
RBTreeNode<K, V>* _right;
RBTreeNode<K, V>* _parent;
Colour _col;
RBTreeNode(const pair<K, V>& kv)
:_kv(kv)
, _left(nullptr)
, _right(nullptr)
, _parent(nullptr)
{}
};
template<class K, class V>
class RBTree
{
typedef RBTreeNode<K, V> Node;
public:
private:
Node* _root = nullptr;
};
2.红黑树的插入
(1)红黑树插入一个值的过程
Ⅰ:插入一个值按二叉搜索树规则进行插入,插入后只需要判断是否符合红黑树的4条规则。
Ⅱ:空树插入,新增节点是黑色节点。非空树插入,新增节点必须是红色节点,因为非空树擦汗如,新增节点为黑色就会破坏规则4.
Ⅲ:非空树插入后,新增节点必须为红色节点,如果父亲节点是黑色,则没有违反任何规则,插入结束。
Ⅳ:非空树插入后,新增节点必须为红色节点,如果父亲节点是红色,则违反规则3。如下图:cur为红色,parent为红色,grandfather必为黑色,关键的变化需要看uncle的情况。
后面的图中,新增节点c(cur),c的父亲节点p(parent),p的父亲节点g(grandfather),p的兄弟节点u(uncle)。
(2)情况1:变色
c为红,p为红,g为黑,u存在且为红,则将p和u变黑,g变红。把g当作新的c,继续往上更新。
分析:
因为p和u都为红色,g为黑色,把p和u变黑,左边子树路径各增加一个黑色节点,违反了规则4,因此g变为红色,能够在保持g所在子树到NULL的各个路径上的黑色节点数量不变,同时还能解决c和p连续红色节点的问题。
需要继续向上更新是因为,g是红色,如果g的父亲还是红色,那么就需要继续处理;如果g的父亲是黑色,则处理结束;如果g就是整棵树的根,再把g变为黑。
根AVL树类似,上面仅为我们展示了一种具体情况,但是实际中需要这样处理的有很多种情况。
接下来我们看一下抽象图。
不论图中 h 等于多少,处理方式都是一样的,先变色再继续往上处理。
(3)情况2:单旋 + 变色
c为红,p为红,g为黑,u不存在或者u存在且为黑。
分析:
p必须变黑,才能解决连续红色节点的问题,u不存在或者是黑色的,单纯的变色无法解决,需要 旋转+变色。
u不存在,则c一定是新增节点:
u存在且为黑,c一定不是新增节点,是在c的子树中插入,符合情况1,变色将c从黑色变成红色:
p是g的左,c是p的左,以g为旋转点进行右单旋,再把p变黑,g变红。p变为这棵树的新根,这样就能保证子树黑色节点的数量不变,并且没有连续的红色节点,且不需要往上更新,因为p的父亲不论是黑色还是红色或者空,都不违反规则。
p是g的右,c是p的右,以g为旋转点进行左单旋,再把p变黑,g变红。p变为这棵树的新根,这样就能保证子树黑色节点的数量不变,并且没有连续的红色节点,且不需要往上更新,因为p的父亲不论是黑色还是红色或者空,都不违反规则。
(4)情况3:双旋 + 变色
c为红,p为红,g为黑,u不存在或者u存在且为黑。
分析:
p必须变黑,才能解决连续红色节点的问题,u不存在或者是黑色的,单纯的变色无法解决,需要 旋转+变色。
u不存在,则c一定是新增节点:
u存在且为黑,c一定不是新增节点,是在c的子树中插入,符合情况1,变色将c从黑色变成红色:
p是g的左,c是p的右,那么先以p为旋转点进行左单旋,再以g为旋转点进行右单旋,再把c变黑,g变红即可。c变成这棵树的新根,这样子树黑色节点的数量不变,并且没有连续的红色节点了,且不需要往上更新,因为c的父亲是黑色或者红色或者空都不违反规则。
p是g的右,c是p的左,那么先以p为旋转点进行右单旋,再以g为旋转点进行左单旋,再把c变黑,g变红即可。c变成这棵树的新根,这样子树黑色节点的数量不变,并且没有连续的红色节点了,且不需要往上更新,因为c的父亲是黑色或者红色或者空都不违反规则。
3.红黑树的插入代码实现
// 旋转代码的实现跟AVL树是⼀样的,只是不需要更新平衡因⼦
bool Insert(const pair<K, V>& kv)
{
if (_root == nullptr)
{
_root = new Node(kv);
_root->_col = BLACK;
return true;
}
Node* parent = nullptr;
Node* cur = _root;
while (cur)
{
if (cur->_kv.first < kv.first)
{
parent = cur;
cur = cur->_right;
}
else if (cur->_kv.first > kv.first)
{
parent = cur;
cur = cur->_left;
}
else
{
return false;
}
}
cur = new Node(kv);
// 新增结点。颜⾊红⾊给红⾊
cur->_col = RED;
if (parent->_kv.first < kv.first)
{
parent->_right = cur;
}
else
{
parent->_left = cur;
}
cur->_parent = parent;
while (parent && parent->_col == RED)
{
Node* grandfather = parent->_parent;
// g
// p u
if (parent == grandfather->_left)
{
Node* uncle = grandfather->_right;
if (uncle && uncle->_col == RED)
{
// u存在且为红 -》变⾊再继续往上处理
parent->_col = uncle->_col = BLACK;
grandfather->_col = RED;
cur = grandfather;
parent = cur->_parent;
}
else
{
// u存在且为⿊或不存在 -》旋转+变⾊
if (cur == parent->_left)
{
// g
// p u
// c
//单旋
RotateR(grandfather);
parent->_col = BLACK;
grandfather->_col = RED;
}
else
{
// g
// p u
// c
//双旋
RotateL(parent);
RotateR(grandfather);
cur->_col = BLACK;
grandfather->_col = RED;
}
break;
}
}
else
{
// g
// u p
Node* uncle = grandfather->_left;
// 叔叔存在且为红,-》变⾊即可
if (uncle && uncle->_col == RED)
{
parent->_col = uncle->_col = BLACK;
grandfather->_col = RED;
// 继续往上处理
cur = grandfather;
parent = cur->_parent;
}
else // 叔叔不存在,或者存在且为⿊
{
// 情况⼆:叔叔不存在或者存在且为⿊
// 旋转+变⾊
// g
// u p
// c
if (cur == parent->_right)
{
RotateL(grandfather);
parent->_col = BLACK;
grandfather->_col = RED;
}
else
{
// g
// u p
// c
RotateR(parent);
RotateL(grandfather);
cur->_col = BLACK;
grandfather->_col = RED;
}
break;
}
}
}
_root->_col = BLACK;
return true;
}
4.红黑树的查找
搜索效率为O(logN)
Node* Find(const K& key)
{
Node* cur = _root;
while (cur)
{
if (cur->_kv.first < key)
{
cur = cur->_right;
}
else if (cur->_kv.first > key)
{
cur = cur->_left;
}
else
{
return cur;
}
}
return nullptr;
}
5.红黑树的验证
这里获取最长路径和最短路径,检查最长路径不超过最短路径的2倍是不可行的因为就算满足这个条件,红⿊树也可能颜色不满足规则。所以我们还是去检查4点规则,满足这4点规则,⼀定能保证最长路径不超过最短路径的2倍。
(1)规则1,枚举颜色类型,天然实现保证了颜色不是黑色就是红色。
(2)规则2,直接检查根即可
(3)规则3,前序遍历检查,遇到红色节点查孩子不太方便,因为孩子有两个,且不一定存在,反过来检查父亲的颜色就方便很多。
(4)规则4,前序遍历检查,遍历过程中用形参记录根到当前节点的blackNum(黑色节点的数量),前序遍历遇到黑色节点就++blackNum,走到空就算出了一条路径的黑色节点数量。再以任意一条路径黑色节点数量作为参考值,依次比较即可。
bool Check(Node* root, int blackNum, const int refNum)
{
if (root == nullptr)
{
// 前序遍历走到空时,意味着⼀条路径⾛完了
//cout << blackNum << endl;
if (refNum != blackNum)
{
cout << "存在⿊⾊结点的数量不相等的路径" << endl;
return false;
}
return true;
}
// 检查孩子不太方便,因为孩⼦有两个,且不⼀定存在,反过来检查父亲就方便多了
if (root->_col == RED && root->_parent->_col == RED)
{
cout << root->_kv.first << "存在连续的红⾊结点" << endl;
return false;
}
if (root->_col == BLACK)
{
blackNum++;
}
return Check(root->_left, blackNum, refNum)
&& Check(root->_right, blackNum, refNum);
}
bool IsBalance()
{
if (_root == nullptr)
return true;
if (_root->_col == RED)
return false;
// 参考值
int refNum = 0;
Node* cur = _root;
while (cur)
{
if (cur->_col == BLACK)
{
++refNum;
}
cur = cur->_left;
}
return Check(_root, 0, refNum);
}