树结合了另外两个数据结构的优点:有序数组和链表。
树的查找和有序数组一样快,插入和删除和链表一样快。
ps,有序链表的查找还是一样的慢。因为链表不能直接访问某个数据项。
树相关的术语:
路径
根
节点--节点通常是一个对象,它包含了数据,以及指向其他节点的引用。
父节点
子节点
叶节点
层
子树
访问
遍历
关键字--对象中常常会有一个数据域作为查找或其他操作的条件。
如果每个节点最多有两个子节点,则称为“二叉树”。通常左节点的关键字值小于父节点,右节点大于等于父节点。
树的操作
查找和插入
二叉树的基本代码,包括查找和插入。
public class Tree {
private Node root;
public Node find(int key){
Node currentNode = new Node();
currentNode = root;
while(key != currentNode.data){
if(key < currentNode.data){
currentNode = currentNode.leftNode;
}
else{
currentNode = currentNode.rightNode;
}
if(currentNode == null){
return null;
}
}
return currentNode;
}
public void insert(int key){
Node newNode = new Node();
newNode.data = key;
if (root == null){
root = newNode;
}
else{
Node currentNode = root;
Node parentNode;
while(true){
parentNode = currentNode;
if(key < currentNode.data){
currentNode = currentNode.leftNode;
if(currentNode == null){
parentNode.leftNode = newNode;
return;
}
}
else{
currentNode = currentNode.rightNode;
if(currentNode == null){
parentNode.rightNode = newNode;
return;
}
}
}
}
}
public void delete(int key){
}
}
//节点类。有时也会添加一个父节点的reference。
class Node{
public int data;
public Node leftNode;
public Node rightNode;
public void displayNode(){
}
}
遍历
中序 inorder 将从树创建有序的数据序列。
前序 preorder 和 后序 postorder 通常用于计算代数表达式。
查找最大值和最小值
非常简单,不讨论
删除节点
删除节点的情况相当复杂,我们必须考虑3种情况:
1,被删除的节点没有子节点。这种情况很简单。
2,被删除的节点有一个子节点。这种情况也不是很难,用被删除的节点的子树代替节点。
3,被删除的节点有两个子节点。相当复杂。。。不讨论。
由于删除非常复杂,所有有一个折中的办法:在每一个节点添加一个boolean值 isDelete。使用树时,先判断一下节点是否已经被删除。
这样删除节点就不会改变树的结构了。
二叉树的问题:
树结构不平衡:树变的不平衡是由于数据项插入的顺序不平衡导致的。结构不平衡会导致严重的效率问题。
想象现在将一个有序数组的元素一一放入一个二叉树:{2,4,5,6,8,12,34}.根据二叉树的定义,我们知道,从root=2开始,所有的元素都将被添加到右子节点。
这样添加完以后形成的结构,就和有序链表一样了。因此就有了链表的弊病,查找相当的慢。
为了弥补二叉树的这个问题,后来出现了红-黑树。
有重复的关键字:当有重复关键字时,按照二叉树的定义,该值会被插入到相同关键字节点的右子节点。但是问题是,find()只能找到第一个节点。
解决方法是1,不允许有重复关键字的节点。2,或修改find方法。