【1】树的定义
树( Tree )是 n(n大于等于0) 个结点的有限集 。 n=0 时称为空树 。 在任意一棵非空树中: ( 1 )有且仅有-个特定的称为根 ( Root )的结点: (2) 当 n>1 时,其余结点可分为 m (m>O) 个互不相变的有限集 T1、T2、…、Tm,其中每一个集合本身又是一棵树,并且称为根的子树( SubTree ).
树T1和子树 T2 就是根结点 A 的子树。当然, D 、 G 、 H 、 l 组成的树又是 B 为结点的子树),E 、 j 组成的树是C 为结点的子树。
对于树的定义还需要强调两点:
1. n>0 时根结点是唯一的,不可能存在多个根结点,别和现实中的大树混在一起,现实中的树有很多根须,那是真实的树,数据结够中的树是只能有一个根结点。
2 . m>O 时,子树的个数没有限制,但它们一定是互不相交的。像下图 中的两个结构就不符合树的定义,因为它们都有相交的子树。
1.1结点分类
树的结点包含一 个数据元素及若干指向其子树的分支。结点拥有的子树数称为结点的度 (Degree) 。度为 0 的结点称为叶结点(Leaf) 或终端结点;度不为 0 的结点称为非终端结点或分支结点 。 除根结点之外,分支结点也称为内部结点。树的度是树
内各结点的度的最大值 。如图所示 , 因为这棵树结点的度的最大值是结点 D 的度,为 3 ,所以树的度也为 3 。
1.2结点间关系
结点的子树的根称为该结点的孩子(Child) ,相应地,该结点称为孩子的双亲(Parent) 。恩,为什么不是父或母,叫双亲呢?呵呵,对于结点来说其父母同体,唯一的一个,所以只能把它称为双亲了。 同一个双亲的孩子之间互称兄弟 (Sibling) 。结点的祖先是从根到该结点所经分支上的所有结点 。所以对于 H 来说, O、B 、 A 都是它的祖先 。 反之 ,以某结点为根的子树中的任一结点都称为该结点的子孙 。 B的子孙有 D 、 G 、 H 、 I.
1.3树的其他相关概念
结点的层次 ( LeveI) 从根开始定义起,根为第一层 , 根的孩子为第二层 。若某结点在第 l 层,则其子树的根就在第 l+1 层。其双亲在同 一层的结点直为堂兄弟 。显然图中的 D 、 E 、 F 是堂兄弟,而 G、H、l、 J 也是。 树中结点的最大层次称为树的深度 ( Dep也)或高度 ,当前树的深度为 4 。
如果将树中结点的各子树看成从左至右是有次序的,不能互换的,则称该树为有序树,否则称为无序树 。
森林 ( Forest) 是 m (m大于等于0)棵互不相交的树的集合 。对树中每个结点而言 ,其子树 的集合即为森林 。
【2】树的抽象数据类型
相对于线性结构,树的操作就完全不同了,这里我们给出 一些基本和常用操作。
【3】树的存储结构
3.1双亲表示法
我们人可能因为种种原因,没有孩子,但无论是谁都不可能是从石头里蹦出来的,孙悟空显然不能算是人,所以是人 一定会有父母。树这种结构也不例外,除了根结点外,其余每个结点,它不一定有孩子,但是一定有且仅有一个双亲。
我们假设以一组连续空间存储树的结点,同时在每个结点中,附设一个指示器指示其双亲结点到链表中的位置 。也就是说,每个结点除了知道自己是谁以外,还知道它的双亲在哪里。它的结点结构为:
其中data 是数据域,存储结点的数据信息。而 parent 是指针域,存储该结点的双亲在数组中的下标。
有了这样的结构定义,我们就可以来实现双亲表示法了。由于根结点是没有双亲的,所以我们约定根结点的位置域设置为 - 1 ,这也就意味着,我们所有的结点都存有它双亲的位置。
这样的存储结构,我们可以根据结点的 parent 指针很容易找到色的双亲结点,所用的时间复杂度为 0(1) ,直到 parent 为一 1 时 ,表示找到了树结点的根。可如果我们要知道结点的孩子是什么,对不起,请遍历整个结构才行。
存储结构的设计是一个非常灵活的过程。一个存储结构设计得是否合理,取决于基于该存储结构的运算是否适合、是否方便,时间复杂度好不好等 。
3.2孩子表示法
换一种完全不同的考虑方法 . 由于树中每个结点可能有多棵子树,可以考虑用多重链衰表即每个结点有多个指针域,其中每个指针指向一棵子树的根结点,我们把这种方法叫做多重链表表示法。不过,树的每个结点的度,也就是它的孩子个数是不同的 。所以可以设计两种方案来决。
方案一:
其中data是数据域。child1到 childd是指针域,用来指向该结点的孩子结点 。
方案二:
其中data为数据域, degree 为度域,也就是存储该结点的孩 子 结点的个数,chìld1到 childd为指针域,指向该结点的各个孩子的结点 。
能否有更好的方法,既可以减少空指针的浪费又能使结点结构相同。
这就是我们要讲的孩子表示法 。 具体办法是 ,把每个结点的孩子结点排列起来,以单链表作存储结构,则 n 个结点有 n 个孩子链表,如果是叶子结点则此单链表为空。
然后 n 个头指针又组成一个线性表,采用顺序存储结构,存放进一个一维数组中。
为此,设计两种结点结构, 一个是孩子链表的孩子结点,
其中child是数据域,用来存储某个结点在表头数组中的下标。 next 是指针域,用来存储指向某结点的下一个孩子结点的指针。
另 一个是表头数组的表头结点
以下是我们的孩子表示法的结构定义代码。
这样的结构对于我们要查找某个结点的某个孩子,或者找某个结点的兄弟,只需要查找这个结点的孩子单链表即可。对于遍历整棵树也是很方便的,对头结点的数组循环即可 。
但是,这也存在着问题,我如何知道某个结点的双亲是谁呢?比较麻烦,需要整棵树遍历才行,难道就不可以把双亲表示法和孩子表示法综合一下吗?当然是可以 。
我们把这种方法称为双亲孩子表示法,应该算是孩子表示法的改进。
3.3孩子兄弟表示法
任意一棵树 , 它的结点的第一个孩子如果存在就是唯一的,它的右兄弟如果存在也是唯一 的 。 因此,我们设置两个指针 , 分别指向该结点的第一个孩子和此结点的右兄弟 。
其中data是数据域, 自firstchild为指针域,存储该结点的第一个孩子结点的存储地址, rightsib 是指针域,存储该结点的右兄弟结点的存储地址 。
这种表示法,给查找某个结点的某个孩子带来了方便,只需要通过fistchild 找到此结点的长子,然后再通过长子结点的 rightsib 找到它的二弟,接着一直下去,直到找到具体的孩子。