树(Tree)是n(n>=0)个结点的有限集。n=0时称为空树。在任意一棵非空树中:(1)有且仅有一个特定的称为根(Root)的结点;(2)当n>1时,其余结点可分为m(m>0)个互不相交的有限集其中每一个集合本身又是一棵树,并且称为根的子树(SubTree)。
树的定义其实就是我们在讲解栈时提到的递归的方法。也就是在树的定义中还用到了树的概念。
对于树的定义还需要强调两点:
1.n>0时根结点是唯一的,不可能存在多个根结点。
2.m>0时,子树的个数没有限制,但它们一定是互不相交的。
结点分类
结点拥有的子树数称为结点的度(Degree)。度为0的结点称为叶节点(Leaf)或终端结点;度不为0的结点称为非终端结点或分支结点。除根节点之外,分支结点也称为内部结点。树的度是树内部结点的度的最大值。
结点间关系
结点的子树的根称为该结点的孩子(Child),相应的,该结点称为孩子的双亲(Parent)。
同一个双亲的孩子之间互称兄弟(Sibling)。结点的祖先是从根到该结点所经分支上的所有结点。
以某结点为根的子树中的任一结点都称为该结点的子孙。
树的其他相关概念
结点的层次(Level)从根开始定义,根为第一层,根的孩子为第二层。
双亲在同一层的结点互为堂兄弟。
树中的最大层次称为树的深度(Depth)或高度。
如果将树中结点的各子树看成从左至右是有次序的,不能互换的,则称该树为有序树,否则称为无序树。
森林(Forest)是m(m>=0)棵互不相交的树的集合。
线性结构与树结构:
线性结构:第一个数据元素:无前驱;最后一个数据元素:无后继;中间元素:一个前驱一个后继。
树结构:根结点:无双亲,唯一;叶结点:无孩子,可以多个;中间结点:一个双亲多个孩子。
树的存储结构
双亲表示法、孩子表示法、孩子兄弟表示法。
双亲表示法:
我们假设以一组连续空间存储树的结点,同时 在每个结点中,附设一个指示器指示双亲结点在数组中的位置。 也就是说,每个结点除了知道自己是谁以外,还知道它的双亲在哪里。
孩子表示法:
由于树中每个结点可能有多棵子树,可以考虑用多重链表,即 每个结点有多个指针域,其中每个指针指向一棵子树的根节点,我们把这种方法叫做多重链表表示法。
不过,树的每个结点的度,也就是他的孩子个数是不同的。所以可以设计两种方案来解决。
1.指针域的个数就等于树的度。
2.每个结点指针域的个数等于该结点的度,我们专门取一个位置来存储结点指针域的个数。
孩子兄弟表示法:
任意一棵树,它的结点的第一个孩子如果存在就是唯一的,它的右兄弟存在也是唯一的。因此,我们设置两个指针,分别指向该结点的第一个孩子和此结点的右兄弟。