一、概念
二叉搜索树又称 二叉排序树(这种树的主要功能为搜索 , 其次为排序) , 它或者是一棵空树,或者是具有一下性质的二叉树:
- 若它是的左子树不为空 , 则左子树上所有结点的值都小于等于根结点的值。
- 若它是的右子树不为空 , 则右子树上所有结点的值都大于等于根结点的值。
- (左 < 根 < 右 ) , ---> 二叉搜索树的中序遍历一定是从小到大(升序)的 。
- 它的 左右子树 也分别为二叉搜索树
- 二叉搜素树可以支持插入相等的值,也可以不支持插入相等的值,具体看使用场景定义,后续我们学习map / set / multimap / multiset 系列 容器底层就是二叉树 , 其中map/set 不支持 插入相等的值,multimap / multiset 支持 插入相等的值
二、性能分析
- 最优情况下,二叉搜索树为完全二叉树(或者接近完全二叉树),其高度为 logN
- 最差情况下,二叉搜索树为单支树(或者类似单支),其高度为 N
所以综合而言 , 二叉搜索树增删查改时间复杂度为:O(N)
那么这样的效率显然是无法满足我们需求的 , 后续介绍的二叉树的变形,平衡二叉树AVL树 和 红黑树 , 才适用于我们在 内存中 存储 和 搜索 数据 。
二分查找也可以实现O(logN) 级别的查找效率,但是二分查找有两大缺陷 :
- 需要存储再支持下标随机访问的结构中,并且有序。
- 插入和删除数据效率很低,因为存储在下标随机访问的结构中,插入和删除数据一般需要挪动数据 。
这里也体现出了平衡二叉树的价值 。
正常情况下,二叉搜索树的增删查的时间复杂度为 O(logN) :
但是,如果数据刚好是有序的,构建的二叉搜索树是单支的 , 时间复杂度增为O(N) ,后续会讲解解决方法:
三、插入
- 树为空 , 则直接新增结点 , 赋值给 root 指针
- 树不为空 , 按二叉搜索树性质,插入值比当前结点大往右走 , 插入值比当前结点小往左走 , 找到空位置 , 插入新结点 。
- 如果支持插入相等的值,插入值跟当前结点相等的值可以往右走,也可以往左走,找到空位置,插入新结点 。(要注意的是保持逻辑一致性 , 插入相等的值不要一会往右走,一会往左走)
插入数据16:
插入数据3:
四、查找
- 从根开始比较, 查找x , x 比根的值 大 则往右边走查找 , 比x根值小则往左边走查找。
- 最多查找高度次,走到空,还没找到,这个值不存在。
- 如果不支持插入相等的值,找到x即可返回。
- 如果支持插入相等的值,意味着有多个x存在 , 一般要求查找中序的第一个x 。 如下图,查找3 , 要找到 1 的右孩子的那个3返回 。
五、删除
- 首先确认一下查找元素是否在二叉搜索树中,如果不存在,则返回false。
- 如果查找元素存在则分以下四种情况分别处理:(假设要删除的结点为N)
- 要删除结点N左右孩子均为空
- 要删除的结点N左孩子位空,右孩子结点不为空
- 删除的结点N右孩子位空,左孩子结点不为空
- 要删除的结点N左右孩子结点均不为空
- 把N结点的父亲对应孩子指针指向空,直接删除N结点(情况1可以当成2或者3处理,效果是⼀样的)
- 把N结点的父亲对应孩子指针指向N的右孩子,直接删除N结点
- 把N结点的父亲对应孩子指针指向N的左孩子,直接删除N结点
- 无法直接删除N结点,因为N的两个孩子无处安放,只能用替换法删除。找N左子树的值最大结点
简单来说:
1)删除叶子结点 : 直接删除即可
2)删除只有左子树或者只有右子树的结点:让只有的那一个子树代替即可
3)删除既有左子树又有右子树的结点:找到删除结点的左子树的最大结点,或者右子树的最小结点 。
六、实现代码
#pragma once
//结点
template<class K>
struct BSTNode
{
K _key;
BSTNode<K>* _left;
BSTNode<K>* _right;
BSTNode(const K& key)
:_key(key)
,_left(nullptr)
,_right(nullptr)
{}
};
template <class K>
//class SearchBinaryTree
class BSTree
{
typedef BSTNode<K> Node;
public:
bool Insert(const K& key)
{
if (_root == nullptr)
{
_root = new Node(key);
return true;
}
Node* parent = nullptr;
Node* cur = _root;
while (cur)
{
if (cur->_key < key)
{
parent = cur;
cur = cur->_right;
}
else if (cur->_key > key)
{
parent = cur;
cur = cur->_left;
}
else
{
return false;
}
}
cur = new Node(key);
if (parent->_key < key)
{
parent->_right = cur;
}
else
{
parent->_left = cur;
}
return true;
}
bool Find(const K& key)
{
Node* cur = _root;
while (cur)
{
if (cur->_key < key)
{
cur = cur->_right;
}
else if (cur->_key > key)
{
cur = cur->_left;
}
else
{
//找到了
return true;
}
}
//走到空,没找到
return false;
}
bool Erase(const K& key)
{
Node* parent = nullptr;
Node* cur = _root;
while (cur)
{
if (cur->_key < key)
{
parent = cur;
cur = cur->_right;
}
else if (cur->_key > key)
{
parent = cur;
cur = cur->_left;
}
else
{
//删除
if (cur->_left == nullptr)
{
//if (parent == nullptr)
if (cur == _root)
{
_root = cur->_right;
}
else
{
// 父亲指向我的右
if (cur == parent->_right)
{
parent->_right = cur->_right;
}
else
{
parent->_left = cur->_right;
}
}
delete cur;
}
else if (cur->_right == nullptr)
{
if (cur == _root)
{
_root = cur->_left;
}
else
{
// 父亲指向我的左
if (cur == parent->_right)
{
parent->_right = cur->_left;
}
else
{
parent->_left = cur->_left;
}
}
delete cur;
}
else
{
// 找右子树最小节点(最左)替代我的位置
Node* minRightParent = cur;
Node* minRight = cur->_right;
while (minRight->_left)
{
minRightParent = minRight;
minRight = minRight->_left;
}
cur->_key = minRight->_key;
if (minRightParent->_left == minRight)
{
minRightParent->_left = minRight->_right;
}
else
{
minRightParent->_right = minRight->_right;
}
delete minRight;
}
return true;
}
}
return false;
}
void InOrder()
{
_InOrder(_root);
cout << endl;
}
private:
void _InOrder(Node* root)
{
if (root == nullptr)
{
return;
}
_InOrder(root->_left);
cout << root->_key << " ";
_InOrder(root->_right);
}
Node* _root = nullptr;
};
#define _CRT_SECURE_NO_WARNINGS 1
#include<iostream>
using namespace std;
#include"SearchBinaryTree.h"
int main()
{
int a[] = { 8, 3, 1, 10, 6, 4, 7, 14, 13 };
BSTree<int> t;
for (auto e : a)
{
t.Insert(e);
}
t.InOrder();
t.Erase(8);
t.InOrder();
t.Erase(14);
t.InOrder();
t.Erase(1);
t.InOrder();
for (auto e : a)
{
t.Erase(e);
t.InOrder();
}
return 0;
}
七、二叉搜索树 key 和 key/value使用场景
7.1 key搜索场景
只有key作为关键码,结构中需要存储 key即可 , 关键码即为需要搜索到的值 , 搜索场景只需要判断 key 在不在 。 key的搜索场景实现的二叉树搜索树支持增删查 , 但是不支持修改 , 修改 key 破坏搜索树结构了。
场景一:小区无人值守车库 , 小区车库买了车位的业主车才能进小区,那么物业会把买了车位的业主的车牌号录入后台系统,车辆进入时扫描车牌在不在系统,在则抬杆 , 不在则提示非本小区车辆 , 无法进入 。
场景二:检查一篇英文文章单词拼写是否正确,将词库所有单词放入二叉搜索树,读取文章中的单词,查找是否在二叉搜索树中,不在则波浪线提示 。
7.2 key/value搜索场景
每一个关键码key , 都有与之对应的值value , value可以为任何类型对象 。树的结构中(结点)除了需要存储 key 还要存储对应的value 。增/删/查还是以key为关键字走二叉搜索树的规则进行比较 , 可以快速查找到 key 对应的 vlue 。 key / value 的搜索场景实现的二叉搜索树支持修改 , 但是不支持修改 key , 修改 key 破坏搜索树的性质了,可以修改 value 。
场景一:简单中英互译字典 , 树的结构中(结点)存储 key(英文) 和 value(中文),搜索时输入英文 , 则同时查找到了英文对应的中文。
场景二:商场无人值守车库,入场进场时扫描车牌 , 记录车牌和入场时间 , 出口离场时,扫描车牌,查找入场时间 , 用当前时间 - 入场时间 计算出停车时长 , 计算出停车费用 , 缴费后抬杠, 车辆离场。
场景三:统计一篇文章中单词出现的次数 , 读取一个单词 , 查找单词是否存在,不存在这个说明第一次出现单词,(单词,1),单词存在 , 则++单词对应的次数 。
7.3 key/value二叉搜索树代码实现
namespace key_value
{
template<class K, class V>
struct BSTNode
{
K _key;
V _value;
BSTNode<K, V>* _left;
BSTNode<K, V>* _right;
BSTNode(const K& key, const V& value)
:_key(key)
, _value(value)
, _left(nullptr)
, _right(nullptr)
{}
};
template<class K, class V>
class BSTree
{
typedef BSTNode<K, V> Node;
public:
bool Insert(const K& key, const V& value)
{
if (_root == nullptr)
{
_root = new Node(key, value);
return true;
}
Node* parent = nullptr;
Node* cur = _root;
while (cur)
{
if (cur->_key < key)
{
parent = cur;
cur = cur->_right;
}
else if (cur->_key > key)
{
parent = cur;
cur = cur->_left;
}
else
{
return false;
}
}
cur = new Node(key, value);
if (parent->_key < key)
{
parent->_right = cur;
}
else
{
parent->_left = cur;
}
return true;
}
Node* Find(const K& key)
{
Node* cur = _root;
while (cur)
{
if (cur->_key < key)
{
cur = cur->_right;
}
else if (cur->_key > key)
{
cur = cur->_left;
}
else
{
return cur;
}
}
return nullptr;
}
bool Erase(const K& key)
{
Node* parent = nullptr;
Node* cur = _root;
while (cur)
{
if (cur->_key < key)
{
parent = cur;
cur = cur->_right;
}
else if (cur->_key > key)
{
parent = cur;
cur = cur->_left;
}
else
{
//删除
if (cur->_left == nullptr)
{
//if (parent == nullptr)
if (cur == _root)
{
_root = cur->_right;
}
else
{
// 父亲指向我的右
if (cur == parent->_right)
{
parent->_right = cur->_right;
}
else
{
parent->_left = cur->_right;
}
}
delete cur;
}
else if (cur->_right == nullptr)
{
if (cur == _root)
{
_root = cur->_left;
}
else
{
// 父亲指向我的左
if (cur == parent->_right)
{
parent->_right = cur->_left;
}
else
{
parent->_left = cur->_left;
}
}
delete cur;
}
else
{
// 找右子树最小节点(最左)替代我的位置
Node* minRightParent = cur;
Node* minRight = cur->_right;
while (minRight->_left)
{
minRightParent = minRight;
minRight = minRight->_left;
}
cur->_key = minRight->_key;
if (minRightParent->_left == minRight)
{
minRightParent->_left = minRight->_right;
}
else
{
minRightParent->_right = minRight->_right;
}
delete minRight;
}
return true;
}
}
return false;
}
void InOrder()
{
_InOrder(_root);
cout << endl;
}
private:
void _InOrder(Node* root)
{
if (root == nullptr)
{
return;
}
_InOrder(root->_left);
cout << root->_key << " " << root->_value << endl;
_InOrder(root->_right);
}
Node* _root = nullptr;
};
}
int main()
{
string arr[] = { "苹果","香蕉","香蕉","西瓜", "苹果", "西瓜", "苹果", "苹果", "西瓜",
"苹果", "香蕉", "苹果", "香蕉","香蕉","香蕉" };
key_value::BSTree<string, int> countTree;
for (auto& e : arr)
{
//key_value::BSTNode<string, int>* ret = countTree.Find(e);
auto ret = countTree.Find(e);
if (ret == nullptr)
{
countTree.Insert(e, 1);
}
else
{
ret->_value++;
}
}
countTree.InOrder();
return 0;
}