目录
1. 树的概念及结构
1.1 树的概念
树是一种非线性的数据结构,它是由n(n>=0)个有限结点组成一个具有层次关系的集合。把它叫做树是因为它看起来像一棵倒挂的树,也就是说它是根朝上,而叶朝下的。
有一个特殊的结点,称为根结点,根结点没有前驱结点。每棵子树的根结点有且只有一个前驱,可以有0个或多个后继。除根结点外,其余结点被分成M(M>0)个互不相交的集合T1、T2、……、Tm,其中每一个集合Ti(1<= i <= m)又是一棵结构与树类似的子树,而子树又由更小的若干棵子树构成。因此,树的定义是递归的。
注意:树形结构中,子树之间不能有交集,否则就不是树形结构。
1.2 树的基本术语
节点的度:一个结点含有的子树的个数称为该结点的度; 如上图:A节点的度为6。
树的度:树中所有节点的度中的最大值称为树的度。
叶子节点或终端节点:度为0的结点称为叶子结点; 如上图:B、C、H、I...等结点为叶子结点。
分支节点或非终端节点:度不为0的结点; 如上图:D、E、F、G...等结点为分支结点。对于度为1的节点,其分支数为1,被称为单分支节点,度为2的节点被称为双分支节点。
双亲结点或父结点:若一个结点含有子结点,则这个结点称为其子结点的父结点; 如上图:A是B的父结点。
孩子结点或子结点:每个节点的后继节点被称为该节点的孩子节点; 如上图:B是A的孩子结点。
兄弟结点:具有同一双亲节点的孩子节点互为兄弟节点; 如上图:B、C是兄弟结点。
堂兄弟结点:双亲在同一层的结点互为堂兄弟;如上图:H、I互为兄弟结点。
祖先节点:从根节点到达该节点的路径上经过的所有节点(除自身外)称为该节点的祖先节点,如上图:节点H的祖先节点有A、D。
子孙节点:每个节点对应子树中的所有节点(除自身外)称为该节点的子孙节点,如上图:节点E的子孙节点有I、J、P、Q。
树的高度或树的深度:树中结点的最大层次; 如上图:树的高度为4
节点层次:从根开始定义起,根节点为第1层,它的孩子结点为第2层,以此类推。
森林:由m(m>=0)棵互不相交的树的集合称为森林,把含多棵子树的树的根节点删去就成了森林。
1.2 树的存储结构
树的实现既要保存值域,也要保存结点和结点之间的关系,实际中树有很多种表示方式:
双亲表示法
是一种顺序存储结构,用一组连续的空间存储树的所有节点,每个节点中都设置一个伪指针指示其双亲节点的位置,除了根节点外,每个节点只有唯一的双亲节点,将根节点的双亲节点的位置设置为特殊值-1。
#define MAX_TREE_SIZE 100
typedef int DataType;
//结点结构
typedef struct PTNode
{
DataType data; //结点数据域
int parent; //双亲位置
}PTNode;
//树结构
typedef struct
{
PTNode nodes[MAX_TREE_SIZE]; //结点数组
int r, n; //根节点的位置和结点数
}PTree;
优点:可以快速找到节点的双亲
缺点:我们要查找某个节点的孩子节点需要遍历整个数组结构。
孩子表示法
孩子表示法存储普通树采用的是 "顺序表+链表" 的组合结构,其存储过程是:从树的根节点开始,使用顺序表依次存储树中各个节点,需要注意的是,与双亲表示法不同,孩子表示法会给各个节点配备一个链表,用于存储各节点的孩子节点位于顺序表中的位置,如果节点没有孩子节点(叶子节点),则该节点的链表为空链表。
链表:child用来存储节点在数组中的下标,next用来存储下一个孩子节点的指针。
顺序表:data用来存储节点的数据信息,firstchild用来存储该节点的孩子链表的头指针。
#define MAX_TRUE_SIZE 100
typedef int DataType;
//孩子链表结构
typedef struct CTNode
{
int child;
struct CTNode* next;
} *ChildPtr; //创建了一个struct CTNode*类型的指针
//表头结构,内含该结点存放的数据和孩子链表的头指针
typedef struct
{
DataType data;
ChildPtr firstchild;
} CTBox;
//树结构
typedef struct
{
CTBox nodes[MAX_TREE_SIZE]; //结点数组
int r, n; //根的位置和结点数
} CTree;
孩子兄弟表示法
typedef int DataType;
struct Node
{
struct Node* firstChild1; // 第一个孩子结点
struct Node* pNextBrother; // 指向其下一个兄弟结点
DataType data; // 结点中的数据域
};
2. 二叉树的概念及结构
2.1 概念
一棵二叉树是结点的一个有限集合,该集合:
- 或者为空
- 由一个根结点加上两棵别称为左子树和右子树的二叉树组成
- 二叉树不存在度大于2的结点
- 二叉树的子树有左右之分,次序不能颠倒,因此二叉树是有序树
注意:对于任意的二叉树都是由以下几种情况复合而成的:
2.2 特殊的二叉树
- 满二叉树:一个二叉树,如果每一个层的结点数都达到最大值,则这个二叉树就是满二叉树。也就是说,如果一个二叉树的层数为K,且结点总数是2^K-1,则它就是满二叉树。
- 完全二叉树:完全二叉树是效率很高的数据结构,完全二叉树是由满二叉树而引出来的。对于深度为K的,有n个结点的二叉树,当且仅当其每一个结点都与深度为K的满二叉树中编号从1至n的结点一一对应时称之为完全二叉树。
注意: 满二叉树是一种特殊的完全二叉树。
2.3 二叉树的性质
- 若规定根结点的层数为1,则一棵非空二叉树的第h层上最多有 2^(h-1)个结点。
- 若规定根结点的层数为1,则深度为h的二叉树的最大结点数是 2^(h-1)。
- 对任何一棵二叉树, 如果度为0其叶子结点个数为n0,度为2的分支结点个数为n2,则有n0=n2+1。
- 若规定根结点的层数为1,具有n个结点的满二叉树的深度h=log₂(n+1)。
2.4 二叉树的存储结构
二叉树一般可以使用两种结构存储,一种顺序结构,一种链式结构。
顺序存储结构
顺序结构存储就是使用数组来存储,一般使用数组只适合表示完全二叉树,对于一般二叉树需要增添一些并不存在的空节点使之变成一颗完全二叉树的形式,会有空间的浪费。二叉树顺序存储在物理上是一个数组,在逻辑上是一颗二叉树。
使用数组存储可以直接用下标算出父子关系:
假设父亲节点在数组中的下标为 i:
左孩子的下标:2*i+1
右孩子的下标:2*i+2
假设孩子节点在数组中的下标为 j:
父亲节点在数组中的下标:(j-1) / 2
显然,完全二叉树或满二叉树采用顺序存储结构比较合适,既能够最大可能地节省存储空间,又可以利用数组元素的下标确定节点在二叉树中的位置及节点之间的关系。普通的二叉树是不适合用数组来存储的,因为可能会存在大量的空间浪费。所以,对于一般二叉树通常采用链式存储方式。
现实中我们通常把堆(一种二叉树)使用顺序结构的数组来存储,需要注意的是这里的堆和操作系统虚拟进程地址空间中的堆是两回事,一个是数据结构,一个是操作系统中管理内存的一块区域分段。
链式存储结构
二叉树的链式存储结构是指,用链表来存储一棵二叉树,二叉树中的每一个节点用链表中的一个节点来存储。
链表中每个结点由三个域组成,数据域和左右指针域,左右指针分别用于存储左孩子节点和右孩子节点的存储地址,这种链式存储结构通常简称为二叉链 。
二叉链存储结构的优点是对于一般的二叉树比较节省存储空间,在二叉链中访问一个节点的孩子很方便,但访问一个节点的双亲需要遍历树。为了高效地访问一个节点的双亲节点,可在每个节点中再增加一个指向双亲的指针域parent,这样就构成了二叉树的三叉链表。
二叉链中节点类型BTNode的声明如下:
typedef int BTDataType;
// 二叉链
typedef struct BinaryTreeNode
{
BTDataType data; // 数据元素
struct BinTreeNode* left; // 指向左孩子节点
struct BinTreeNode* right; // 指向右孩子节点
}BTNode;
三叉链中节点类型BTNode的声明如下:
typedef int BTDataType;
// 三叉链
typedef struct BinaryTreeNode
{
BTDataType data; // 数据元素
struct BinTreeNode* parent; // 指向双亲节点
struct BinTreeNode* left; // 指向左孩子节点
struct BinTreeNode* right; // 指向右孩子节点
}BTNode;