“哈夫曼树”介绍
给定N个权值作为N个叶子结点,构造一棵二叉树,若该树的带权路径长度达到最小,称这样的二叉树为最优二叉树,也称为哈夫曼树(Huffman Tree)
特点
哈夫曼树是带权路径长度最短的树,权值较大的结点离根较近
相关术语
1.路径和路径长度
在一棵树中,从一个结点往下可以达到的孩子或孙子结点之间的通路,称为路径。通路中分支的数目称为路径长度。若规定根结点的层数为1,则从根结点到第L层结点的路径长度为L-1
2.结点的权及带权路径长度
若将树中结点赋给一个有着某种含义的数值,则这个数值称为该结点的权。结点的带权路径长度为:从根结点到该结点之间的路径长度与该结点的权的乘积
3.树的带权路径长度
树的带权路径长度规定为所有叶子结点的带权路径长度之和
前期准备
结构体——存储结点信息
struct ElemType{
int weight;
int parent,lchild,rchild;
};
类的声明
class HuffmanTree
{
public:
HuffmanTree(int w[ ], int n);
HuffmanTree( );
void Print( );
private:
ElemType *huffTree; //数组用于存储哈夫曼树
int num; //统计叶子结点数量
void Select(int n, int &i1, int &i2); //选取叶子函数
};
类的实现
成员函数
1.构造函数
使用数组存储结点数据。
构造思路:
(1)对结构体数组初始化(包括建立空间、标记父子关系)并将叶子结点 w1、w2、…,wn的权值抄入结构体数组中;
(2) 选出两个根结点的权值最小的树合并,作为一棵新树的左、右子树,且新树的根结点权值为其左、右子树根结点权值之和;并对新结点和子树进行匹配;
(3)将新树加入数组中(放入叶子结点后面的位置);
(4)重复(2)、(3)步,直到森林中只剩一棵树为止,该树即为所求得的哈夫曼树。
含n个叶子结点的二叉树经过合并后,分支结点共(n-1)个,哈夫曼树的结点数为(2n-1).
HuffmanTree::HuffmanTree(int w[ ], int n){
//构造哈夫曼树
num=n;
huffTree=new ElemType[2*n-1]; //建立存储数组
int i,k,i1,i2; //i为叶子结点循环变量,k标记求和后的节点,i1、i2标记最小次小元素位置
for(int i=0;i<2*num-1;i++){ //初始化,将parent、lchild、rchild均置为-1
huffTree[i].parent=-1;
huffTree[i].lchild=huffTree[i].rchild=-1;
}
for(int i=0;i&