1. 树的定义
树 (Tree) 是 n(n>=0) 个结点的有限集。当 n=0 时成为空树,在任意一棵非空树中:有且仅有一个特定的称为根(Root)的结点;当n>1时,其余结点可分为m(m>0)个互不相交的有限集T1、T2、…、Tm,其中每一个集合本身又是一棵树,并且称为根的子树(SubTree),即如下图所示
虽然从概念上很容易理解树,但是有两点还是需要大家注意下:n>0时,根结点是唯一的,坚决不可能存在多个根结点;m>0时,子树的个数是没有限制的,但它们互相是一定不会相交的。比如说下面的两种情况就不是树
刚才所有图片中,每一个圈圈我们就称为树的一个结点。结点拥有的子树数称为结点的度-(Degree),树的度取树内各结点的度的最大值。度为0的结点称为叶结点(Leaf)或终端结点;度不为0的结点称为分支结点或非终端结点,除根结点外,分支结点也称为内部结点。
1.1 结点间的关系
结点的子树的根称为结点的孩子(Child),相应的,该结点称为孩子的双亲(Parent)(注意是双亲而不是父亲),同一双亲的孩子之间互称为兄弟(Sibling)。结点的祖先是从根到该结点所经分支上的所有结点。
1.2 结点的层次
结点的层次(Level)从根开始定一起,根为第一层,根的孩子为第二层。其双亲在同一层的结点互为堂兄弟。树中结点的最大层次称为树的深度(Depth)或高度。
2. 树的存储结构
要存储树,简单的顺序存储结构和链式存储结构是不能滴!不过如果充分利用它们各自的特点,完全可以间接地来实现。这里要介绍三种不同的表示法:双亲表示法、孩子表示法、孩子兄弟表示法。
2.1 双亲表示法
双亲表示法,言外之意就是以双亲作为索引的关键词的一种存储方式。我们假设以一组连续空间存储树的结点,同时在每个结点中,附设一个指示其双亲结点在数组中位置的元素。也就是说,每个结点除了知道自己是谁之外,还知道它的双亲在哪里,如下图所示
具体定义的结构如下
// 树的双亲表示法结点结构定义
#define MAX_TREE_SIZE 100
typedef int ElemType;
typedef struct PTNode
{
ElemType data; // 结点数据
int parent; // 双亲位置
}PTNode;
typedef struct
{
PTNode nodes[MAX_TREE_SIZE];
int r; // 根的位置
int n; // 结点数目
}PTree;
这样的存储结构,我们可以根据某结点的parent指针找到它的双亲结点,所用的时间复杂度是O(1),索引到parent的值为-1时,表示找到了树结点的根。可是,如果我们要知道某结点的孩子是什么?那么不好意思,请遍历整个树结构。
为了解决这个问题,稍微改变一下结构,如下图所示,可以清楚的找到每个结点的孩子(其中的-1 代表没有)。
那现在我们又比较关心它们兄弟之间的关系呢?可以采用下图的方法
2.2 孩子表示法
在这里给出三种孩子表示法,其中前两种只是用来思考,最后一种用来真正的实践。
第一种方法根据树的度,声明足够空间存放子树指针的结点。
其中的每一个“^”就代表一个空,所以缺点十分明显,造成了大量的浪费!
第二种方法如下图所示
这样我们就克服了浪费这个概念,我们从此走上了节俭的社会主义道路!但每个结点的度的值不同,初始化和维护起来难度巨大吧?
第三种方法如下图所示
我们可以看到数组就是这样,左侧是数组的序号,右侧是连接孩子结点的头指针,后面跟着的是他的孩子结点。每个孩子结点的第一个数是孩子节点下标,第二个数是双亲相同的另一个孩子的下标。
具体结构的代码如下所示
#define MAX_TREE_SIZE 100
typedef char ElemType; // 孩子结点
// 孩子结点
typedef struct CTNode
{
int child; // 孩子结点的下标
struct CTNode *next; // 指向下一个孩子结点的指针
} *ChildPtr;
// 表头结构
typedef struct
{
ElemType data; // 存放在树中的结点的数据
int parent; // 存放双亲的下标
ChildPtr firstchild; // 指向第一个孩子的指针
} CTBox;
// 树结构
typedef struct
{
CTBox nodes[MAX_TREE_SIZE]; // 结点数组
int r, n;
}
2.3 孩子表示法双亲孩子表示法
那只找到孩子找不到双亲貌似还不够完善,那么我们合并上一讲的双亲孩子表示法。