树(Tree)和二叉树(Binary Tree)是计算机科学中重要的数据结构,广泛应用于算法、数据库、文件系统等领域。以下是它们的核心概念、分类和特点的总结:
一、树(Tree)
1. 基本定义
- 树是由节点(Node)和边(Edge)组成的层次化数据结构,满足以下条件:
- 有且仅有一个根节点(Root),无父节点。
- 除根节点外,每个节点有且仅有一个父节点。
- 所有节点通过边连接,无环路。
2. 核心概念
- 根节点:树的顶层节点,无父节点。
- 子节点:一个节点直接连接的下级节点。
- 父节点:一个节点的直接上级节点。
- 叶子节点(Leaf):没有子节点的节点。
- 子树:以某个节点为根的子树,包含其所有后代节点。
- 深度:从根节点到当前节点的路径长度(根节点深度为0或1,取决于定义)。
- 高度:从当前节点到最远叶子节点的路径长度(叶子节点高度为0或1)。
3. 树的分类
类型 | 描述 |
---|
普通树 | 任意节点可以有多个子节点(无限制)。 |
二叉树 | 每个节点最多有2个子节点(左子节点和右子节点)。 |
二叉搜索树 | 二叉树的一种,左子树所有节点的值 < 根节点值 < 右子树所有节点的值。 |
平衡树 | 如AVL树、红黑树,通过旋转操作保持树的高度平衡,确保操作效率(如查找为O(log n))。 |
B树/B+树 | 多路平衡搜索树,用于数据库和文件系统,支持高效磁盘存取。 |
二、二叉树(Binary Tree)
1. 基本定义
- 每个节点最多有2个子节点(左子节点和右子节点)。
- 是树的一种特例,但应用更广泛(如表达式树、哈夫曼编码等)。
2. 二叉树的分类
类型 | 描述 |
---|
满二叉树 | 所有非叶子节点都有2个子节点,且所有叶子节点在同一层。 |
完全二叉树 | 除最后一层外,其他层节点全满,且最后一层节点从左到右连续填充。 |
完美二叉树 | 所有层的节点全满(是满二叉树和完全二叉树的特例)。 |
二叉搜索树 | 左子树节点值均小于根节点,右子树节点值均大于根节点(支持高效查找、插入、删除)。 |
线索二叉树 | 利用空指针域存储遍历顺序的前驱或后继信息,优化遍历效率。 |
3. 二叉树的遍历
遍历方式决定了访问节点的顺序,常见方法:
遍历方式 | 访问顺序 | 应用场景 |
---|
前序遍历 | 根 → 左子树 → 右子树 | 复制树结构、表达式求值(前缀表达式)。 |
中序遍历 | 左子树 → 根 → 右子树 | 二叉搜索树中输出有序序列。 |
后序遍历 | 左子树 → 右子树 → 根 | 释放内存、表达式求值(后缀表达式)。 |
层序遍历 | 按层次从上到下、从左到右访问节点 | 求树的宽度、按层处理节点。 |
示例(中序遍历):
对于二叉搜索树,中序遍历结果是一个有序序列(如 [1,3,4,6,7,8,10]
)。
4. 二叉树的存储
- 链式存储:通过节点对象存储值和左右子节点指针(常用)。
- 顺序存储:用数组表示,适合完全二叉树(父节点索引为
i
,左子节点为2i+1
,右子节点为2i+2
)。
三、树 vs 二叉树
特性 | 树 | 二叉树 |
---|
子节点数 | 任意数量(无限制) | 最多2个子节点 |
应用场景 | 文件系统、组织结构 | 表达式树、哈夫曼编码、搜索算法 |
遍历复杂度 | 需处理多个子节点 | 固定遍历左、右子节点 |
存储结构 | 多叉链表或左孩子右兄弟表示 | 链式或顺序存储 |
四、二叉树的应用
- 表达式树:表示数学表达式,支持前序、中序、后序遍历生成不同表达式形式。
- 哈夫曼编码:用二叉树生成最优前缀编码,用于数据压缩。
- 二叉搜索树:高效查找、插入、删除(平均时间复杂度O(log n))。
- 堆(完全二叉树):实现优先队列,用于堆排序、Dijkstra算法等。
- 决策树:机器学习中的分类模型,通过二叉树路径进行决策。
五、代码示例(二叉树的链式存储)
class TreeNode:
def __init__(self, value):
self.val = value
self.left = None
self.right = None
root = TreeNode(1)
root.left = TreeNode(2)
root.right = TreeNode(3)
root.left.left = TreeNode(4)
root.left.right = TreeNode(5)
def inorder_traversal(node):
if node:
inorder_traversal(node.left)
print(node.val, end=' ')
inorder_traversal(node.right)
inorder_traversal(root)
总结
- 树是层次化数据组织的核心结构,二叉树因其简单性和高效性成为最常用的树形结构。
- 理解二叉树的遍历、存储方式及变种(如二叉搜索树、堆)是算法和系统设计的基础。
- 实际应用中需根据需求选择树的类型(如需要高效查找选二叉搜索树,需要压缩数据选哈夫曼树)。