树
1、树的基本概念
一种表示层次关系(一对多)的数据结构
有且仅有一个特定的节点,该节点没有前驱,被称为根节点。
剩余的n个互不相交的子集组成,其中的每一个子集也都是一棵树,被称为根节点的子树
注意:树型结构具有递归性(树中有树)
2、树的表示方法:倒悬树、嵌套法、凹凸法
3、树的专业术语(不同资料略有不同)
节点:组成树的基础元素,同时它也可以是一棵树
节点的度:该节点子树的数量
树的度:树中的节点的数量
节点的层次:根节点层次为1,它的孩子层次为2,孩子的孩子层次为3,以此类推
树的深度/高度:树的最大层次数
叶子节点:节点的度为0的节点
双亲和孩子:节点的子树都称为孩子节点,该节点就是它们的双亲节点
兄弟:具有同一个双亲节点,被称为兄弟节点
祖先:从根节点出发到该节点,中间经过的所有节点都称为它的祖先
子孙:一个节点的子树中的任意一个节点都称为它的子孙
堂兄弟:双亲在同一层的节点,称为堂兄弟节点
森林:n个互不相交的树的集合称为森林
4、树的存储
树可以顺序存储、链式存储,还可以混合存储,由于存储的信息不同,有以下三种常见表示方式:
双亲表示法(顺序):
位置 data 双亲下标
优点:方便找到双亲
缺点:不方便找孩子
孩子表示法(顺序):
位置 data sub_arr
缺点:浪费空间
孩子表示法(链式+顺序):
位置 data sub_list
优点:节约空间
孩子表示法(不管什么方法):
优点:找孩子方便
缺点:找双亲不方便
兄弟表示法:
双亲只存储第一个孩子节点,然后链式指向所有的兄弟节点
第一个子节点 数据 兄弟链表头结点
优点:可以方便查询到所有的兄弟节点
缺点:查询双亲比较麻烦
总结:普通树不常用,一般会转换成二叉树使用
二叉树
是一种常用的数据结构
定义:所有节点的度最多为2
二叉树的性质:【重点】
性质1:二叉树的第i层上至多有2^(i-1)(i≥1)个节点。
满二叉树:每层的节点数都是2^(i-1)
完全二叉树:
1、深度为k,有n个结点的二叉树当且仅当其每一个结点都与深度为k的满二叉树中编号从1到n的结点一一对应时,称为完全二叉树
2、除了最后一层外,其余每一层都是满的,最后一层的节点必须从左到右分布,就是完全二叉树
3、如果所有的节点都满足从上到下、从左到右分布,就是完全二叉树
性质2:深度为h的二叉树中至多含有2^h-1个节点。
性质3:若在任意一棵二叉树中,有n0个叶子节点,有n2个度为2的节点,则必有n0=n2+1。
性质4:具有n个节点的完全二叉树深为log2n+1 log2的n次方+1
性质5:若对一棵有n个节点的完全二叉树进行顺序编号(1≤i≤n),那么,对于编号为i(i≥1)的节点:
当i=1时,该节点为根,它无双亲节点。
当i>1时,该节点的双亲节点的编号为i/2。
若2i≤n,则有编号为2i的左节点,否则没有左节点。
若2i+1≤n,则有编号为2i+1的右节点,否则没有右节点。
二叉树的操作:
构建、销毁、遍历、高度、密度、插入、删除、求左、求右、求根
二叉树的遍历:
前序:根 左 右
中序:左 根 右
后序:左 右 根
注意:前中后由根节点决定,并且左右子树的次序不能改变
注意:根据前序+中序 或者 后序+中序 可以还原出一棵树,但是前序+后序是无法还原的
层序遍历:从上到下,从左到右来遍历一棵树,必须配合队列使用
二叉树的存储:
1、顺序:必须按照完全二叉树的格式进行存储,空位置使用特殊数据代替
数据项:
存储节点的内存首地址
容量
注意:通过编号的关系来找到双亲、孩子节点
2、链式:由一个个节点组成,通过左右子树指针指向自己左右子树
节点数据项:
数据
左子树指针
右子树指针
有序二叉树
左子树的数据小于根,右子树大于等于根,这种树叫做有序二叉树
注意:由于有序二叉树的节点需要频繁地插入删除,因此不适合采用顺序存储
有序二叉树的中序遍历,一定是从小到大,所以有序二叉树也是一种排序算法,它的查找天然又是二分查找,所以经常考。
线索二叉树
规律:在有n个节点的链式二叉树中,必定有n+1个空指针域
链式二叉树中有很多的空指针,可以让这些指针的一部分指向下一个节点,这样遍历树时可以不用递归而是使用循环,提高树的遍历速度
中序线索二叉树:
节点数据项:
数据
左子树指针
右子树指针
右子树指针标志(真表示指向的是下一个节点,假表示指向的就是右子树)
实现过程:
1、创建线索
2、按照线索进行遍历
注意:线索二叉树的主要目的是为了提高树的遍历速度
// 上一个节点
TreeNode* prev = NULL;
// 按照中序遍历,并创建线索
void create_clue(TreeNode* root)
{
if(NULL == root) return;
// 左
create_clue(root->left);
// 根
if(NULL != prev && NULL == prev->right)
{
prev->right = root;
prev->rclue = true;
}
// 判断结束后,root就变成了上一个节点
prev = root;
// 右
create_clue(root->right);
}
// 按照线索进行遍历
void clue_show(TreeNode* node)
{
while(node)
{
while(node->left) node = node->left;
printf("%d ",node->data);
while(node->rclue)
{
node = node->right;
printf("%d ",node->data);
}
node = node->right;
}
}
线索二叉树的其他功能和有序二叉树一样
选择树(胜者树、败者树)
是一颗完全二叉树,把待比较的数据存储在最后一次,根节点是左右子树中的一个,是它们的最大或最小的作为根,选择树的功能是能够方便地找出树中的最大值或者最小值。
堆
是一种完全二叉树,不适合链式存储
大顶堆(大根堆):根节点比左右子树大
小顶堆(小根堆):根节点比左右子树小
数据项:
存储数据的内存首地址
容量
数量
运算:
创建、添加、删除、空堆、满堆、堆顶
使用堆可以实现优先队列
平衡二叉树
前提是有序的二叉树,它的左右子树的高度差不超过1,而且它的所有子树也要满足这个条件。
如果一棵有序二叉树呈单支状(接近单支状),它的查找效率接近链表,因此如果让它达到平衡的状态它的效率才最高
由于节点的位置是受值的影响,因此只能进行调整,而不能强行修改
二叉树不平衡的基础原因:
x y
/ \ / \
y t1 以y为轴向右旋转 z x
/ \ / \ / \
z t2 t3 t4 t2 t1
/ \
t3 t4
x y
/ \ / \
t1 y 以y为轴向左旋转 x z
/ \ / \ / \
t2 z t1 t2 t3 t4
/ \
t3 t4
x x z
/ \ / \ / \
y t1 z t1 y x
/ \ / \ / \ / \
t2 z y t4 t2 t3 t4 t1
/ \ / \
t3 t4 t2 t3
以z为轴向左旋转 以z为轴向右旋转 最终达到平衡
x x z
/ \ / \ / \
t1 y t1 z x y
/ \ / \ / \ / \
z t2 t3 y t1 t3 t4 t2
/ \ / \
t3 t4 t4 t2
以z为轴向右旋转 以z为轴向左旋转 最终达到平衡
红黑树
也是一种自平衡的有序二叉树,它不是根据子树的高度差来调整平衡的,而是给每个节点设置红或黑两种颜色,以此达到平衡。
优点:插入、删除的效率要比AVL树要高
缺点:没有AVL树均匀,查找效率没有AVL树高