前言
前面对map/multimap/set/multiset进行了简单的介绍,这几个容器有个共同点是:其底层都是按照二叉搜索树来实现的,但是二叉搜索树有其自身的缺陷,假如往树中插入的元素有序或者接近有序,二叉搜索树就会退化成单支树,时间复杂度会退化成O(N),因此map、set等关联式容器的底层结构是对二叉树进行了平衡处理,即采用平衡二叉树来实现。
二叉搜索树虽可以缩短查找的效率,但如果数据有序或接近有序二叉搜索树将退化为单支树,查找元素相当于在顺序表中搜索元素,效率低下。因此,两位俄罗斯的数学家G.M.Adelson-Velskii和E.M.Landis在1962年发明了一种解决上述问题的方法:当向二叉搜索树中插入新结点后,如果能保证每个结点的左右子树高度之差的绝对值不超过1(需要对树中的结点进行调整),即可降低树的高度,从而减少平均搜索长度
一、AVL树的概念
- 左右子树都是AVL树,
- 左右子树的高度差(平衡因子)的绝对值不超过1(-1/0/1)
以控制在 O(logN),相比二叉搜索树有了本质的提升。

二、AVL树的实现
2.1 AVL树的节点的定义和结构
代码如下(示例):
#pragma once
#include<iostream>
#include<assert.h>
using namespace std;
template<class K, class V>
struct AVLTreeNode
{
pair<K, V> _kv;
AVLTreeNode<K, V>* _left;
AVLTreeNode<K, V>* _right;
AVLTreeNode<K, V>* _parent;
size_t _bf;
AVLTreeNode(const pair<K, V>& kv)
:_kv(kv)
,_left(nullptr)
,_right(nullptr)
,_parent(nullptr)
,_bf(0)
{ }
};
template<class K, class V>
class AVLTree
{
typedef AVLTreeNode<K, V> Node;
public:
//
//
//
private:
Node* _root = nullptr;
};
平衡二叉树实现原理:
平衡二叉树构建的基本思想就是在构建二叉排序树的过程中,每当插入一个结点时,先检查是否因插入而破坏了树的平衡性,若是,则找出最小不平衡子树。在保持二叉排序树特性的前提下,调整最小不平衡子树中各结点之间的链接关系,进行相应的旋转,使之成为新的平衡子树。
2.2 AVL树的插入
AVL树就是在二叉搜索树的基础上引入了平衡因子,因此AVL树也可以看成是二叉搜索树。那么AVL树的插入过程可以分为两步:
- 按照二叉搜索树的方式插入新节点
- 调整节点的平衡因子
2. 2. 1 AVL树插入流程
- 按二叉搜索树规则进行插入值。
-
新增结点以后,只会影响祖先结点的高度,也就是可能会影响部分祖先结点的平衡因子,所以更新从新增结点->根结点路径上的平衡因子,实际中最坏情况下要更新到根,有些情况更新到中间就可以停止了,具体情况我们下面再详细分析。
-
新平衡因子过程中没有出现问题,则插入结束。
-
更新平衡因子过程中出现不平衡,对不平衡的子树旋转,旋转本质是调平衡,降低了子树的高度,不会再影响上⼀层,所以插入结束。
2. 2. 2 平衡因子更新
更新原则:
- 平衡因子 = 右子树高度-左子树高度
- 只有⼦树⾼度变化才会影响当前结点平衡因⼦。
- 插⼊结点,会增加⾼度,所以新增结点在parent的右⼦树,parent的平衡因子++,新增结点在parent的左子树,parent平衡因子--
- parent所在子树的⾼度是否变化决定了是否会继续往上更新
更新停止条件:
- 更新后parent的平衡因⼦等于0,更新中parent的平衡因⼦变化为-1->0 或者 1->0,说明更新前parent⼦树⼀边⾼⼀边低,新增的结点插⼊在低的那边,插⼊后parent所在的⼦树⾼度不变,不会影响parent的⽗亲结点的平衡因⼦,更新结束。
- 更新后parent的平衡因子等于1 或 -1,更新前parent的平衡因⼦变化为0->1 或者 0->-1,说明更新前parent子树两边⼀样高,新增的插⼊结点后,parent所在的⼦树⼀边⾼⼀边低,parent所在的子树符合平衡要求,但是⾼度增加了1,高度发生变化会影响parent的⽗亲结点的平衡因子,所以要继续向上更新。
- 更新后parent的平衡因子等于2 或 -2,更新前parent的平衡因子变化为1->2 或者 -1->-2,说明更新前parent子树一边高一边低,新增的插⼊结点在⾼的那边,parent所在的⼦树⾼的那边更⾼了,破坏了平衡,parent所在的⼦树不符合平衡要求,需要旋转处理,旋转的⽬标有两个:1、把parent子树旋转平衡。2、降低parent子树的高度,恢复到插⼊结点以前的⾼度。所以旋转后也不需要继续往上更新,插⼊结束。
- 不断更新,更新到根,跟的平衡因⼦是1或-1也停⽌了。
更新到10结点,平衡因子为2,10所在的子树已经不平衡,需要旋转处理
更新到中间结点,3为根的子树高度不变,不会影响上一层,更新结束
最坏更新到根停止
2. 2. 3 插入结点和更新结点的代码实现
template<class k, class v>
class AVLTree
{
typedef AVLTreeNode<k, v> Node;
public:
bool Insert(const pair<k, v>& kv)
{
if (_root == nullptr)
{
_root = new Node(kv);
return true;
}
Node* cur = _root;
Node* parent = nullptr;
while (cur)
{
if (cur->_kv.first < kv.first)
{
parent = cur;
cur = cur->_right;
}
else if (cur->_kv.first > kv.first)
{
parent = cur;
cur = cur->_left;
}
else
{
return false;
}
}
cur = new Node(kv);//新增结点和它的父节点建立链接
if (parent->_kv.first < kv.first) parent->_right = cur;
else parent->_left = cur;
cur->_parent = parent;
// ... 控制平衡
// 更新平衡因子
while (parent)//一路向上更新到根就该停止了
{
if (cur == parent->_left)
{
parent->_bf--;
}
else // if (cur == parent->_right)
{
parent->_bf++;
}
//看前面的祖先结点bf
if (parent->_bf == 0)
{
// 更新结束
break;
}
else if (parent->_bf == 1 || parent->_bf == -1)
{
// 继续往上更新
cur = parent;
parent = parent->_parent;
}
else if (parent->_bf == 2 || parent->_bf == -2)
{
// 子树不平衡了,需要旋转
if (parent->_bf == 2 || cur->bf == 1)
{
RotateL(parent);
}
else if (parent->_bf == -2 || cur->_bf == -1)
{
RotateR(parent);
}
else if (parent->_bf == -2 || cur->_bf == 1)
{
RotateLR(parent);
}
else if (parent->_bf == 2 || cur->_bf == -1)
{
RotateRL(parent);
}
break;
}
else
{
assert(false);
}
}
return true;
}
2. 3 旋转
如果在一棵原本是平衡的AVL树中插入一个新节点,可能造成不平衡,此时必须调整树的结构,使之平衡化。根据节点插入位置的不同,AVL树的旋转分为四种:左单旋/右单旋/左右双旋/右左双旋。
2. 3. 1 旋转的规则
- 保持搜索树的规则
- 让旋转的树从不平衡到平衡,其次降低旋转树的⾼度
2. 3. 2 右单旋
新节点插入较高左子树的左侧---左左:右单旋
本图展示的是10为根的树,有a/b/c抽象为三棵⾼度为h的⼦树(h>=0),a/b/c均符合AVL树的要求。10可能是整棵树的根,也可能是⼀个整棵树中局部的⼦树的根。这⾥a/b/c是⾼度为h的⼦树,是⼀种概括抽象表⽰,他代表了所有右单旋的场景,实际右单旋形态有很多种
上图在插入前,AVL树是平衡的,新节点插入到5的左子树(注意:此处不是左孩子)中,5的左子树增加了一层,导致以10为根的二叉树不平衡,要让10平衡,只能将10左子树的高度减少一层,右子树增加一层。
即将左子树往上提,这样10转下来,因为10比5大,只能将其放在5的右子树,而如果5有右子树,右子树根的值一定大于5,小于10,只能将其放在10的左子树,旋转完成后,更新节点的平衡因子即可。在旋转过程中,有以下几种情况需要考虑:
- 5节点的右孩子可能存在,也可能不存在
- 10可能是根节点,也可能是子树。如果是根节点,旋转完成后,要更新根节点为5。如果是子树,可能是某个节点的左子树,也可能是右子树,把更新后的根节点向上链接。
实现代码:
void RotateR(Node* parent)
{
//定义节点的指针
Node* SubL = parent->_left;
Node* SubLR = SubL->_right;
parent->_left = SubLR;
if(SubLR)//判断一下右子树存不存在
SubLR->_parent = parent;
//提前保留parent的父节点
Node* parentParent = parent->_parent;
SubL->_right = parent;
parent->_parent = SubL;
//插入之前parent时根节点
if (parentParent == nullptr) // parent = _root;
{
_root = SubL;
SubL->_parent = nullptr;
}
//插入之前parent是一个子树的根节点
else
{
if (parent == parentParent->_left)
parentParent->_left = SubL;
else
parentParent->_right = SubL;
SubL->_parent = parentParent;
}
parent->_bf = SubL->_bf == 0;
}
2. 3. 3 左单旋
新节点插入较高右子树的右侧---右右:左单旋
本图在a子树中插⼊一个新结点,导致a子树的高度从h变成h+1,不断向上更新平衡因子,导致10的平衡因子从1变成2,10为根的树左右高度差超过1,违反平衡规则。10为根的树右边太高了,需要往左边旋转,控制两棵树的平衡
旋转核心步骤,因为10 < b子树的值 < 15,将b变成10的右子树,10变成15的左子树,15变成这棵树新的根,符合搜索树的规则,控制了平衡,同时这棵的高度恢复到了插入之前的h+2,符合旋转原则。如果插⼊之前10整棵树的⼀个局部子树,旋转后不会再影响上⼀层,插⼊结束。
左单旋代码实现:
void RotateL(Node* parent)
{
Node* SubR = parent->_right;
Node* SubRL = SubR->_left;
parent->_right = SubRL;
if (SubRL)
SubRL->_parent = parent;
Node* parentParent = parent->_parent;
SubR->_left = parent;
parent->_parent = SubR;
if (parentParent == nullptr)
{
_root = SubR;
SubR->_parent = nullptr;
}
else
{
if (parent == parentParent->_left)
parentParent->_left = SubR;
else
parentParent->_right = SubR;
SubR->_parent = parentParent;
}
parent->_bf == SubR->_bf == 0;
}
2. 3. 4 左右双旋
新节点插入较高左子树的右侧---左右:先左单旋再右单旋
通过图1和图2可以看到,左边⾼时,如果插⼊位置不是在a⼦树,⽽是插⼊在b⼦树,b⼦树⾼度从h变成h+1,引发旋转,右单旋⽆法解决问题,右单旋后,我们的树依旧不平衡。右单旋解决的纯粹的左边⾼,但是插⼊在b⼦树中,10为跟的⼦树不再是单纯的左边⾼,对于10是左边⾼,但是对于5是右边⾼,需要⽤两次旋转才能解决,以5为旋转点进⾏⼀个左单旋,以10为旋转点进⾏⼀个右单旋,这棵树这棵树就平衡了。
图1:
图2:
图1和图2分别为左右双旋中h==0和h==1具体场景分析,下⾯我们将a/b/c⼦树抽象为⾼度h的AVL⼦树进⾏分析,另外我们需要把b⼦树的细节进⼀步展开为8和左⼦树⾼度为h-1的e和f⼦树,因为我们要对b的⽗亲5为旋转点进⾏左单旋,左单旋需要动b树中的左⼦树。b⼦树中新增结点的位置不同,平衡因⼦更新的细节也不同,通过观察8的平衡因⼦不同,这⾥我们要分三个场景讨论。
- 场景1:h >= 1时,新增结点插⼊在e⼦树,e⼦树⾼度从h-1并为h并不断更新8->5->10平衡因⼦,引发旋转,其中8的平衡因⼦为-1,旋转后8和5平衡因⼦为0,10平衡因⼦为1。
- 场景2:h >= 1时,新增结点插⼊在f⼦树,f⼦树⾼度从h-1变为h并不断更新8->5->10平衡因⼦,引发旋转,其中8的平衡因⼦为1,旋转后8和10平衡因⼦为0,5平衡因⼦为-1。
- 场景3:h == 0时,a/b/c都是空树,b⾃⼰就是⼀个新增结点,不断更新5->10平衡因⼦,引发旋转,其中8的平衡因⼦为0,旋转后8和10和5平衡因⼦均为0。
左右双旋代码实现:
void RotateLR(Node* parent)
{
Node* SubL = parent->_left;
Node* SubLR = SubL->_right;
int bf = SubLR->_bf;
RotateL(parent->_left);
RotateR(parent);
if (bf == -1)
{
SubLR->_bf = 0;
SubL->_bf = 0;
parent->_bf = 1;
}
else if (bf == 1)
{
SubLR->_bf = 0;
SubL->_bf = -1;
parent->_bf = 0;
}
else if (bf == 0)
{
SubLR->_bf = 0;
SubL->_bf = 0;
parent->_bf = 0;
}
else
{
assert(false);
}
}
2. 3. 5 右左双旋
新节点插入较高右子树的左侧---右左:先右单旋再左单旋
跟左右双旋类似,下⾯我们将a/b/c⼦树抽象为⾼度h的AVL⼦树进⾏分析,另外我们需要把b⼦树细节进⼀步展开为12和左⼦树⾼度为h-1的e和f⼦树,因为我们要对b的⽗亲15为旋转点进⾏右单旋,右单旋需要动b树中的右⼦树。b⼦树中新增结点的位置不同,平衡因⼦更新的细节也不同,通过观察12的平衡因⼦不同,这⾥我们要分三个场景讨论。
- 场景1:h >= 1时,新增结点插⼊在e⼦树,e⼦树⾼度从h-1变为h并不断更新12->15->10平衡因⼦,引发旋转,其中12的平衡因⼦为-1,旋转后10和12平衡因⼦为0,15平衡因⼦为1。
- 场景2:h >= 1时,新增结点插⼊在f⼦树,f⼦树⾼度从h-1变为h并不断更新12->15->10平衡因⼦,引发旋转,其中12的平衡因⼦为1,旋转后15和12平衡因⼦为0,10平衡因⼦为-1。
- 场景3:h == 0时,a/b/c都是空树,b⾃⼰就是⼀个新增结点,不断更新15->10平衡因⼦,引发旋转,其中12的平衡因⼦为0,旋转后10和12和15平衡因⼦均为0。
右左双旋代码实现:
void RotateRL(Node* parent)
{
Node* subR = parent->_right;
Node* subRL = subR->_left;
int bf = subRL->_bf;
RotateR(parent->_right);
RotateL(parent);
if (bf == 0)
{
subR->_bf = 0;
subRL->_bf = 0;
parent->_bf = 0;
}
else if (bf == 1)
{
subR->_bf = 0;
subRL->_bf = 0;
parent->_bf = -1;
}
else if (bf == -1)
{
subR->_bf = 1;
subRL->_bf = 0;
parent->_bf = 0;
}
else
{
assert(false);
}
}
2. 4 AVL树的查找
Node* Find(const K& key)
{
Node* cur = _root;
while (cur)
{
if (cur->_kv.first < key)
{
cur = cur->_right;
}
else if (cur->_kv.first > key)
{
cur = cur->_left;
}
else
{
return cur;
}
}
return nullptr;
}
2. 5 代码实现
AVLTree.h
#pragma once
#include<iostream>
#include<assert.h>
using namespace std;
//template<class K, class V>
//struct AVLTreeNode
//{
// pair<K, V> _kv;
// AVLTreeNode<K, V>* _left;
// AVLTreeNode<K, V>* _right;
// AVLTreeNode<K, V>* _parent;
// size_t _bf;
//
// AVLTreeNode(const pair<K, V>& kv)
// :_kv(kv)
// ,_left(nullptr)
// ,_right(nullptr)
// ,_parent(nullptr)
// ,_bf(0)
// { }
//
//};
//
//template<class K, class V>
//class AVLTree
//{
// typedef AVLTreeNode<K, V> Node;
//public:
// //
// //
// //
//private:
// Node* _root = nullptr;
//};
template<class k, class v>
struct AVLTreeNode
{
pair<k, v> _kv;
AVLTreeNode<k, v>* _left;
AVLTreeNode<k, v>* _right;
AVLTreeNode<k, v>* _parent;
int _bf;
AVLTreeNode(const pair<k, v>& kv)
:_kv(kv)
, _left(nullptr)
, _right(nullptr)
, _parent(nullptr)
, _bf(0)
{ }
};
template<class k, class v>
class AVLTree
{
typedef AVLTreeNode<k, v> Node;
public:
AVLTree()
:_root(nullptr)
{} // 添加默认构造
bool Insert(const pair<k, v>& kv)
{
if (_root == nullptr)
{
_root = new Node(kv);
return true;
}
Node* cur = _root;
Node* parent = nullptr;
while (cur)
{
if (cur->_kv.first < kv.first)
{
parent = cur;
cur = cur->_right;
}
else if (cur->_kv.first > kv.first)
{
parent = cur;
cur = cur->_left;
}
else
{
return false;
}
}
cur = new Node(kv);//新增结点和它的父节点建立链接
if (parent->_kv.first < kv.first)
{
parent->_right = cur;
}
else
{
parent->_left = cur;
}
cur->_parent = parent;
// ... 控制平衡
// 插入结点以后更新插入结点的祖先的平衡因子
// 更新平衡因子
while (parent)//一路向上更新到根就该停止了对于parent == 1的情况一直往上更新 parent为nullptr即为结束条件
{
if (cur == parent->_left)
{
parent->_bf--;
}
else // if (cur == parent->_right)
{
parent->_bf++;
}
//看前面的祖先结点bf
if (parent->_bf == 0)
{
// 更新结束
break;
}
else if (parent->_bf == 1 || parent->_bf == -1)
{
// 继续往上更新
cur = parent;
parent = parent->_parent;
}
else if (parent->_bf == 2 || parent->_bf == -2)
{
// 子树不平衡了,需要旋转
if (parent->_bf == 2 && cur->_bf == 1)
{
RotateL(parent);
}
else if (parent->_bf == -2 && cur->_bf == -1)
{
RotateR(parent);
}
else if (parent->_bf == -2 && cur->_bf == 1)
{
RotateLR(parent);
}
else if (parent->_bf == 2 && cur->_bf == -1)
{
RotateRL(parent);
}
break;
}
else
{
assert(false);
}
}
return true;
}
void RotateR(Node* parent)
{
//定义节点的指针
Node* SubL = parent->_left;
Node* SubLR = SubL->_right;
parent->_left = SubLR;
if(SubLR)//判断一下右子树存不存在
SubLR->_parent = parent;
//提前保留parent的父节点
Node* parentParent = parent->_parent;
SubL->_right = parent;
parent->_parent = SubL;
//插入之前parent时根节点
if (parentParent == nullptr) // parent = _root;
{
_root = SubL;
SubL->_parent = nullptr;
}
//插入之前parent是一个子树的根节点
else
{
if (parent == parentParent->_left)
parentParent->_left = SubL;
else
parentParent->_right = SubL;
SubL->_parent = parentParent;
}
parent->_bf = SubL->_bf = 0;
}
void RotateL(Node* parent)
{
Node* SubR = parent->_right;
if (SubR == nullptr) {
// Handle the error or return early
return;
}
Node* SubRL = SubR->_left;
parent->_right = SubRL;
if (SubRL)
SubRL->_parent = parent;
Node* parentParent = parent->_parent;
SubR->_left = parent;
parent->_parent = SubR;
if (parentParent == nullptr)
{
_root = SubR;
SubR->_parent = nullptr;
}
else
{
if (parent == parentParent->_left)
parentParent->_left = SubR;
else
parentParent->_right = SubR;
SubR->_parent = parentParent;
}
parent->_bf = SubR->_bf = 0;
}
void RotateLR(Node* parent)
{
Node* SubL = parent->_left;
Node* SubLR = SubL->_right;
int bf = SubLR->_bf;
RotateL(parent->_left);
RotateR(parent);
if (bf == -1)
{
SubLR->_bf = 0;
SubL->_bf = 0;
parent->_bf = 1;
}
else if (bf == 1)
{
SubLR->_bf = 0;
SubL->_bf = -1;
parent->_bf = 0;
}
else if (bf == 0)
{
SubLR->_bf = 0;
SubL->_bf = 0;
parent->_bf = 0;
}
else
{
assert(false);
}
}
void RotateRL(Node* parent)
{
Node* subR = parent->_right;
Node* subRL = subR->_left;
int bf = subRL->_bf;
RotateR(parent->_right);
RotateL(parent);
if (bf == 0)
{
subR->_bf = 0;
subRL->_bf = 0;
parent->_bf = 0;
}
else if (bf == 1)
{
subR->_bf = 0;
subRL->_bf = 0;
parent->_bf = -1;
}
else if (bf == -1)
{
subR->_bf = 1;
subRL->_bf = 0;
parent->_bf = 0;
}
else
{
assert(false);
}
}
Node* Find(const pair<k, v>& kv)
{
Node* cur = _root;
while (cur)
{
if (cur->_kv.first < kv.first)
{
cur = cur->_right;
}
else if (cur->_kv.first > kv.first)
{
cur = cur->_left;
}
else
{
return cur;
}
}
return nullptr;
}
void InOrder()
{
_InOrder(_root);
cout << endl;
}
void _InOrder(Node* root)
{
if (root == nullptr)
{
return;
}
_InOrder(root->_left);
cout << root->_kv.first << " ";
_InOrder(root->_right);
}
private:
Node* _root = nullptr;
};
Test.cpp
#include "AVLTree.h"
//#include<vector>
// 测试代码
void TestAVLTree1()
{
AVLTree<int, int> s;
// 常规的测试用例
int a[] = { 16, 3, 7, 11, 9, 26, 18, 14, 15 };
// 特殊的带有双旋场景的测试用例
//int a[] = { 4, 2, 6, 1, 3, 5, 15, 7, 16, 14 };
for (auto e : a)
{
s.Insert({ e, e });
}
s.InOrder();
assert(s.Find({ 5,5 }));
//cout << t.IsBalanceTree() << endl;
}
void TestAVLTree()
{
AVLTree<int, int> tree;
// 测试插入
assert(tree.Insert({ 10, 10 }));
assert(tree.Insert({ 20, 20 }));
assert(tree.Insert({ 30, 30 }));
assert(tree.Insert({ 40, 40 }));
assert(tree.Insert({ 50, 50 }));
assert(tree.Insert({ 25, 25 }));
// 测试查找
assert(tree.Find({ 10, 10 }) != nullptr);
assert(tree.Find({ 20, 20 }) != nullptr);
assert(tree.Find({ 30, 30 }) != nullptr);
assert(tree.Find({ 40, 40 }) != nullptr);
assert(tree.Find({ 50, 50 }) != nullptr);
assert(tree.Find({ 25, 25 }) != nullptr);
assert(tree.Find({ 60, 60 }) == nullptr);
// 测试中序遍历
tree.InOrder(); // 应该输出: 10 20 25 30 40 50
}
int main()
{
TestAVLTree1();
//TestAVLTree();
//std::cout << "所有测试用例通过!" << std::endl;
return 0;
}
总结
AVL树是一棵绝对平衡的二叉搜索树,其要求每个节点的左右子树高度差的绝对值都不超过1,这样可以保证查询时高效的时间复杂度,即O(logN)。但是如果要对AVL树做一些结构修改的操作,性能非常低下,比如:插入时要维护其绝对平衡,旋转的次数比较多,更差的是在删除时,有可能一直要让旋转持续到根的位置。因此:如果需要一种查询高效且有序的数据结构,而且数据的个数为静态的(即不会改变),可以考虑AVL树,但一个结构经常修改,就不太适合。