2016.08.20
上课内容:哈夫曼树
哈夫曼树(霍夫曼树)又称为最优二叉树.
1、路径和路径长度
在一棵树中,从一个结点往下可以达到的孩子或孙子结点之间的通路,称为路径。通路中分支的数目称为路径长度。若规定根结点的层数为1,则从根结点到第L层结点的路径长
2、结点的权及带权路径长度
若将树中结点赋给一个有着某种含义的数值,则这个数值称为该结点的权。结点的带权路径长度为:从根结点到该结点之间的路径长度与该结点的权的乘积。
3、树的带权路径长度
树的带权路径长度规定为所有叶子结点的带权路径长度之和,记为WPL
WPL=(W1*L1+W2*L2+W3*L3+...+Wn*Ln)
N个权值Wi(i=1,2,...n)构成一棵有N个叶结点的二叉树,相应的叶结点的路径长度为Li(i=1,2,...n)。
哈夫曼树的形式如图1所示:
父节点(parent)又分为左节点(left)和右节点(right),其遍历方式有四种,即:前序遍历,中序遍历,后续遍历,层次遍历
图3为带权路径长度的算法,哈夫曼树的带权路径最短。
练习:找出哈夫曼树的节点和带权值
import java.util.*;
public class HuffmanTree
{
public static class Node<E>
{
E data;
double weight;
Node leftChild;
Node rightChild;
public Node(E data , double weight)
{
this.data = data;
this.weight = weight;
}
public String toString()
{
return "Node[数字:" + data + " 频率:" + weight + "]";
}
}
public static void main(String[] args)
{
List<Node> nodes = new ArrayList<Node>();
nodes.add(new Node("A" , 40.0));
nodes.add(new Node("B" , 8.0));
nodes.add(new Node("C" , 10.0));
nodes.add(new Node("D" , 30.0));
nodes.add(new Node("E" , 10.0));
nodes.add(new Node("F" , 2.0));
Node root = HuffmanTree.createTree(nodes);
System.out.println(breadthFirst(root));
}
/**
* 构造哈夫曼树
* @param nodes 节点集合
* @return 构造出来的哈夫曼树的根节点
*/
private static Node createTree(List<Node> nodes)
{
//只要nodes数组中还有2个以上的节点
while (nodes.size() > 1)
{
quickSort(nodes);
//获取权值最小的两个节点
Node left = nodes.get(nodes.size() - 1);
Node right = nodes.get(nodes.size() - 2);
//生成新节点,新节点的权值为两个子节点的权值之和
Node parent = new Node(null , left.weight + right.weight);
//让新节点作为权值最小的两个节点的父节点
parent.leftChild = left;
parent.rightChild = right;
//删除权值最小的两个节点
nodes.remove(nodes.size() - 1);
nodes.remove(nodes.size() - 1);
//将新生成的父节点添加到集合中
nodes.add(parent);
}
//返回nodes集合中唯一的节点,也就是根节点
return nodes.get(0);
}
//将指定数组的i和j索引处的元素交换
private static void swap(List<Node> nodes, int i, int j)
{
Node tmp;
tmp = nodes.get(i);
nodes.set(i , nodes.get(j));
nodes.set(j , tmp);
}
//实现快速排序算法,用于对节点进行排序。从大到小的排序
private static void subSort(List<Node> nodes, int start , int end)
{
//需要排序
if (start < end)
{
//以第一个元素作为分界值
Node base = nodes.get(start);
//i从左边搜索,搜索大于分界值的元素的索引
int i = start;
//j从右边开始搜索,搜索小于分界值的元素的索引
int j = end + 1;
while(true)
{
//找到大于分界值的元素的索引,或i已经到了end处
while(i < end && nodes.get(++i).weight >= base.weight);
//找到小于分界值的元素的索引,或j已经到了start处
while(j > start && nodes.get(--j).weight <= base.weight);
if (i < j)
{
swap(nodes , i , j);
}
else
{
break;
}
}
swap(nodes , start , j);
//递归左子序列
subSort(nodes , start , j - 1);
//递归右边子序列
subSort(nodes , j + 1, end);
}
}
public static void quickSort(List<Node> nodes)
{
subSort(nodes , 0 , nodes.size() - 1);
}
//广度优先遍历
public static List<Node> breadthFirst(Node root)
{
Queue<Node> queue = new ArrayDeque<Node>();
List<Node> list = new ArrayList<Node>();
if( root != null)
{
//将根元素入“队列”
queue.offer(root);
}
while(!queue.isEmpty())
{
//将该队列的“队尾”的元素添加到List中
list.add(queue.peek());
Node p = queue.poll();
//如果左子节点不为null,将它加入“队列”
if(p.leftChild != null)
{
queue.offer(p.leftChild);
}
//如果右子节点不为null,将它加入“队列”
if(p.rightChild != null)
{
queue.offer(p.rightChild);
}
}
return list;
}
}
哈夫曼树的应用:
在通信及数据传输中多采用二进制编码。为了使电文尽可能的缩短,可以对电文中每个字符出现的次数进行统计。设法让出现次数多的字符的二进制码短些,而让那些很少出现的字符的二进制码长一些。
在数中令左边分支去编码为0,右边编码为1,将从根节点到某个叶子节点上的各左、右分支的编码顺序排列,就得到这个叶子节点所代表的字符的二进制编码,如图4所示。
这些编码拼成的电文不会混淆,因为每个字符的编码不是其它编码的前缀,这种编码称为前缀编码。