数据结构笔记之----查找_二叉搜索数搜索6 涉及数据1 2 4 5 7 8 9-优快云博客

本文链接：https://blog.youkuaiyun.com/u012599545/article/details/47022723

本文详细介绍了二叉树的各种类型，包括二叉搜索树、二叉平衡树、红黑树等，以及它们的插入、删除操作原理。此外，还深入探讨了B树、B+树等多路查找树的特点与应用场景，并对比了各种查找算法的性能。

1、二叉搜索树（排序树、查找树）的搜索、插入、删除，时间复杂度？

目的：提高查找和插入删除关键字的速度，不是为了排序。

（1）性质：

若它的左子树不为空，则左子树上所有节点的值均小于它的根结构的值。

若它的右子树不为空，则右子树上所有节点的值均大于它的根节点的值。

它的左右子树也分别为二叉排序树。

2、二叉平衡树插入节点的原理，有哪几种旋转方式？分别适用于哪种情况，分析二叉平衡树的时间复杂度。

平衡二叉树是一种二叉排序树，其中每一个节点的左子树和右子树的高度差至多等于1。其中左子树深度减去右子树深度为平衡因子，BF取值为-1,0,1。最小不平衡子树的概念。

原理：插入结点，若破坏了平衡性，则找出最小不平衡子树，进行旋转，成为新的平衡子树。

时间复杂度为logn，相当于是折半查找。见后面的说明。

AVL树的平衡插入操作

#include <iostream>
using namespace std;
struct Node
{
	int value;
	int bf;
	Node *lchild;
	Node *rchild;
	Node(){lchild=NULL;rchild=NULL;}
};
void R_Rotate(Node *&T)
{
	Node *p=T->lchild;
	T->lchild=p->rchild;
	p->rchild=T;
	T=p;
}
void L_Rotate(Node *&T)
{
	Node *p=T->rchild;
	T->rchild=p->lchild;
	p->lchild=T;
	T=p;
}
void LeftBalance(Node *&T)
{
	Node *p=T->lchild;
	switch(p->bf)
	{
		case 1://说明插在左孩子的左子树下，需要右旋转
			T->bf=p->bf=0;
			R_Rotate(T);
			break;
		case -1://需要做双旋转
			Node *pr=p->rchild;
			switch(pr->bf)
			{
			case 1:
				T->bf=-1;
				p->bf=0;
				break;
			case 0://这种情况是pr是刚插入的，所以没有子树
				T->bf=p->bf=0;
				break;
			case -1:
				T->bf=0;
				p->bf=1;
				break;
			}
			pr->bf=0;
			L_Rotate(T->lchild);
			R_Rotate(T);
	}
}
void RightBalance(Node *&T)
{
	Node *p=T->rchild;
	switch(p->bf)
	{
		case -1:
			T->bf=p->bf=0;
			L_Rotate(T);
			break;
		case 1://需要做双旋转
			Node *pl=p->lchild;
			switch(pl->bf)
			{
			case -1:
				T->bf=1;
				p->bf=0;
				break;
			case 0://这种情况是pl是刚插入的，所以没有子树
				T->bf=p->bf=0;
				break;
			case 1:
				T->bf=0;
				p->bf=-1;
				break;
			}
			pl->bf=0;
			R_Rotate(T->rchild);
			L_Rotate(T);
	}
}
bool InsertAVL(Node *&T,bool &Taller,int key)
{
	if(T==NULL)
	{
		T=new Node();
		T->bf=0;
		T->value=key;
		Taller=true;
		return true;
	}
	else
	{
		if(T->value==key)
		{
			Taller=false;
			return false;
		}
		if(T->value>key)
		{
			if(!InsertAVL(T->lchild,Taller,key))
				return false;
			if(Taller)//说明在左子树下插入成功
			{
				switch(T->bf)
				{
					case 1://说明原来左边就高
						LeftBalance(T);//平衡旋转之后高度不变，且能够修改相关的平衡因子
						Taller=false;
						break;
					case 0://原来相等
						T->bf=1;
						Taller=true;//只有这个时候是长高了的
						break;
					case -1:
						T->bf=0;
						Taller=false;
						break;
				}
			}			
		}
		else if(T->value<key)
		{
			if(!InsertAVL(T->rchild,Taller,key))
				return false;
			if(Taller)//说明在右子树下插入成功
			{
				switch(T->bf)
				{
					case -1://说明原来右边就高
						RightBalance(T);//平衡旋转之后高度不变，且能够修改相关的平衡因子
						Taller=false;
						break;
					case 0://原来相等
						T->bf=-1;
						Taller=true;//只有这个时候是长高了的
						break;
					case 1:
						T->bf=0;
						Taller=false;
						break;
				}				
			}
		}
		return true;
	}
}
void PrintTree(Node *T)
{
	if(T!=NULL)
	{
		cout<<T->value<<" ";
		PrintTree(T->lchild);
		PrintTree(T->rchild);
	}
}
int main()
{
	int a[10]={3,2,1,4,5,6,7,10,9,8};
	Node *T=NULL;
	bool Taller;
	for(int i=0;i<10;i++)
	{
		InsertAVL(T,Taller,a[i]);
	}
	PrintTree(T);
	system("pause");
}

代码调试成功

插入思想：对于任意一个节点，都要看在其子树下面插入是否有长高，那么根据在左右子树插入，以及原来平衡因子的情况。可以进行平衡处理或者修改平衡引子的操作。

平衡思想：对于一个需要平衡处理的子树T，比如要左平衡处理，那么根据左子树p原来的情况进行操作，

如果为1，那么修改平衡引子，直接右旋。

如果为-1，那么需要双旋转。根据下面的右子树pr（-1,0,1）来进行判断，来修改平衡因子，注意为0的时候是刚插入的，然后先对子树左旋，再整个右旋。无论pr是哪种情况

，旋转之后其平衡因子都为0.而为pr为0的时候pr/T平衡因子也为0

右旋：旋转为左孩子的右孩子，并做相应的操作。

3、红黑树的定义，红黑树的性能分析和与二叉平衡树的比较。

参考：http://blog.youkuaiyun.com/v_JULY_v/article/category/774945

http://blog.youkuaiyun.com/silangquan/article/details/18655795

红黑树和AVL类似，都是在进行插入删除的时候通过特定操作保持二叉查找树的平衡，从而获得较高的查找性能。其统计性能比AVL树要好。

红黑树与AVL树的区别？

（1）前者利用颜色来识别来标识结点的高度，追求的局部平衡，而不是AVL树种的非常严格平衡（STL中的关联式容器默认右红黑树实现）

（2）红黑树是AVL树的变种，通过着色法确保：没有一条路径会比其他路径长出两倍，故而达到接近平衡的目的。

（3）性质：

1、每个节点不是红色就是黑色。

2、根节点为黑色。

3、若节点为红色，其子节点必为黑色。

4、任意一个节点，到NULL（树尾端）黑色节点数必须相同。

上述规则保证了这个树大致平衡，也决定了红黑树的插入、删//查询快速。

（4）插入：

根据规则4，新增节点必须为红。

:黑父：

若新节点的父节点为黑色，那么插入一个红节点，不会影响红黑树的平衡。故而插入完成。

红父：

若父为红，则祖父必为黑，根据叔来调整。

1、红叔：

无需进行旋转，只需将父与叔变为黑色，祖父变红。但由祖父节点的父节点可能为红，违3.此时必须将祖父节点作为新的判定点，向上（迭代）。

2、黑叔：

分以下4种情况：父亲和孩子都在左边，父亲和孩子都在右边，此时做一次旋转即可。而另外2种情况则是将新节点做为根黑节点，将祖父变红，作为其子树。

可以看出，哪个最为最后的根节点，则变为黑色，而原来的根节点则变为红色

插入操作：解决的是红→红的问题。

（5）删除：

对于平衡状态下的红黑树，要么是单支黑红，要么是有两个节点。以这个为原则。

a、若删除的节点为红色，则删除后红黑性质不会被破坏，操作结束。单支黑红。

b、若为黑色则红黑性质会破坏，需要相应的调整。

以有两个子树的情况为例：和二叉搜索树一样，找到右子树中最小的点，将值做替换，但是颜色不交换，因此把问题转移到删除右子树中最小的节点的问题。记为y

，y没有左子树，其右孩子为x假设有的话。

情况1，当y为红色时，删除无影响。

情况1，当y为黑色，x为红色时，将y删除，x移到y的位置，将x颜色变红。

情况2，当y为黑色，x为黑色时，则要看原来y位置兄弟的情况。

不过总体思路是：

若兄弟为红，改变父兄颜色，左旋转。转到2.

兄弟为黑，且侄子为红，改变兄弟为红，达到平衡，相当于少了一个黑色节点。

兄弟为黑，左侄子为红，右侄子为黑，则兄弟右旋。转到4.

兄弟为黑，左侄子任意，右侄子为红，则交换父兄颜色，父节点左旋，相当于左边加了一个黑节点。

情况1：x的兄弟w为红色，则w的儿子必然全黑，w父亲p也为黑。

改变p与w的颜色，同时对p做一次左旋，这样就将情况1转变为情况2,3,4的一种。

情况2：x的兄弟w为黑色，x与w的父亲颜色可红可黑。

因为x子树相对于其兄弟w子树少一个黑色节点，可以将w置为红色，这样，x子树与w子树黑色节点一致，保持了平衡。

new x为x与w的父亲。new x相对于它的兄弟节点new w少一个黑色节点。如果new x为红色，则将new x置为黑，则整棵树平衡。否则，

~~情况2转换为情况1,3,4~~ 情况2转变为情况1,2,3,4.

情况3：w为黑色，w左孩子红色，右孩子黑色。

交换w与左孩子的颜色，对w进行右旋。转换为情况4

情况4：w为黑色，右孩子为红色。

交换w与父亲p颜色，同时对p做左旋。这样左边缺失的黑色就补回来了，同时，将w的右儿子置黑，这样左右都达到平衡。

个人认为这四种状况比较难以理解，总结了一下。情况2是最好理解的，减少右子树的一个黑色节点，使x与w平衡，将不平衡点上移至x与w的父亲。

进行下一轮迭代。情况1：如果w为红色，通过旋转，转成成情况1,2,3进行处理。而情况3转换为情况4进行处理。也就是说，情况4是最接近最终解

的情况。情况4：右儿子是红色节点，那么将缺失的黑色交给右儿子，通过旋转，达到平衡。

4、B树、B+树、Trie的概念及用途，添加删除节点的原理。

B树的功能是提高了此判断额IO性能，但是没有解决元素遍历效率很低的问题，其思路是将数据分散到所有的结点中，如查找一个数，根据范围去找到指针，去磁盘找到数据块，再读取，不断去找，IO性能提高，但是对于范围性的查找，就需要遍历整个B树，效率较低。

B+树对B树进行了扩展，其B+树的数据都集中在叶结点，上层结点只是数据的索引，并不包含数据信息。这样当进行范围性查找的时候，只需要从叶子节点遍历即可。因此一般的关系型数据库都喜欢用B+树做索引，但是也有用红黑树做索引的。

多路查找树：一个节点的孩子数可以多于两个，且一个节点处可以存储多个元素。

（1）2-3树

其中的每一个节点都具有两个孩子或者三个孩子。

一个2节点包含一个元素和2个孩子（或没有孩子）

一个3节点包含一小一大两个元素和三个孩子（或没有孩子）

图：

插入实现：需要进行一些调整。

（2）2-3-4树

包括了4节点，包含小中大三个元素和4个孩子（或者没有孩子）

（3）B树

B树是一种平衡的多路查找树，2-3树和2-3-4树都是B树的特例，节点最大的孩子数目为B树的阶（order）如2-3-4树是4阶B树。

一个m阶的B树具有如下性质：

a、如果根节点不是叶节点，则其至少有两棵子树。

b、每一个非根的分支节点都有k-1个元素和k个孩子。其中[m/2]<=k<=m。 [x] 注意上面闭下面开。为不小于x的最小整数。而每一个叶子节点有k-1个元素

c、所有叶子节点都位于同一层次。

d、所有分支节点包含下列信息数据

如图：

对于n个关键字的m阶B树，最坏情况要查找几次？

第一层至少有一个节点，那么第二层至少有2个节点，根据性质b，那么第三层有2*（[m/2]）个节点，而第k层有2*（[m/2]）的k-2次方个节点。而对于第k层有2*（[m/2]）的

k-1次方个节点，而k+1层就是叶子节点，当找到叶子节点时，实际上有n+1个节点是查找不成功的。故n+1>=2*（[m/2]）的k-1次方。从而可以推出：

k<=log[m/2]((n+1)/2)+1

也就是说查找次数不超过这么多次。

应用场合：

主要用于大量数据的查找工作。将每个节点看成硬盘不同页面，这样讲根节点放在内存中，这样找其余节点时，只需要去外存找几次就可以了。（页面换入换出）

（4）B+树

和B树的差异在于：

a、有n棵子树的节点中包含有n个关键字。

b、所有的叶子节点包含全部关键字的信息，及指向含这些关键字记录的指针，叶子节点本身依关键字的大小自小而大的顺序链接。

c、所有分支节点可以看成是索引，节点中仅含有其子树中的最大（或最小）关键字。

如果是随机查找，则从根节点出发，与B树查找方式相同，如果是顺序查找，则从最小关键字从小到大进行查找。

图：

5、hash查找

Hash函数示例

代码如下：

#include "stdafx.h"
#include<iostream>
using namespace std;
const int INF=65535;
struct HashTable
{
	int *elem;
	int count;//存储HashTable中元素的个数
}H;
void InitHashTable(HashTable &H)//要动态数组存储元素
{
	cout<<"请输入元素个数，以enter结束"<<endl;
	cin>>H.count;
	cout<<'\n';
	H.elem=new int[H.count];
	for(int i=0;i<H.count;i++)
		H.elem[i]=INF;
}

void InsertHash(HashTable &H,int key)
{
	int addr=key % H.count;//获取地址
	while(H.elem[addr]!=INF)//判断是否冲突，即里面看有没有值
		addr=(addr+1) % H.count;
	H.elem[addr]=key;//找到空的就插入
}
void SearchHash(const HashTable &H,int key)
{
	int addr=key % H.count;
	int temp=addr;
	while(H.elem[addr]!=key)
	{
		addr=(addr+1) % H.count;
		if(addr==temp)//说明回到原点
		{
			cout<<"找不到这个关键字"<<endl;
			return;
		}
	}
	cout<<"关键字的位置是"<<addr<<endl;


}
int _tmain(int argc, _TCHAR* argv[])
{
	InitHashTable(H);
	int key;
	cout<<"请输入"<<H.count<<"个Hash元素"<<endl;
	for(int i=0;i<H.count;i++)
	{		
		cin>>key;
		InsertHash(H,key);
	}
	while(getchar()!='a')
	{
		cout<<"请输入要查找的Hash元素值"<<endl;
		cin>>key;
		SearchHash(H,key);
	}
 return 0;
}

输出结果是：

请输入元素个数，以enter结束
5

请输入5个Hash元素
1 2 4 20 84
请输入要查找的Hash元素值
1
关键字的位置是1
请输入要查找的Hash元素值
2
关键字的位置是2
请输入要查找的Hash元素值
4
关键字的位置是4
请输入要查找的Hash元素值
20
关键字的位置是0
请输入要查找的Hash元素值
84
关键字的位置是3
请输入要查找的Hash元素值