一. 赫夫曼树(最优二叉树)
- 设二叉树具有n个带权值的叶子结点,从根结点到每一个叶子结点都有一个路径长度。
- 从根结点到各个叶子结点的路径长度与相应结点权值的乘积的和称为该二叉树的带权路径长度,记作

其中,Wi为第i个叶子结点的权值,Li为 第i个叶子结点的路径长度。
如:

- 给定一组具有确定权值的叶子结点,可以构造出许多的二叉树。
例如,用4个整数2,3,4,11作为4个叶子结点的权值,总共可以构造出120棵不同的二叉树,他们的带权路径长度可能不相同,把其中具有最小带权路径长度的二叉树称为赫夫曼树。

二. 构造赫夫曼树
- 根据赫夫曼树的定义,一棵二叉树要使其WPL值最小,必须使权值较大的叶子结点越靠近根结点。
- 而权值最小的叶子结点越远离根结点。
- 构造过程:
①. 由给定的n个权值{W1,W2,…,Wn}构造n棵只有一个根结点的二叉树,从而得到一个二叉树的集合F={T1,T2,…,Tn}。
②. 在F中选取根结点的权值最小和次小的两棵二叉树Ti,Tj 进行合并,即增加一个根结点,将Ti,Tj 分别作为它的左右子树,该根结点的权值为其左右子树根结点权值之和。
③. 重复步骤②,当F中只剩下一棵二叉树时,这颗二叉树便是所要建立的赫夫曼树。

三. 赫夫曼编码
- 赫夫曼编码具有广泛的应用,利用赫夫曼树构造的用于通信的二进制编码称为赫夫曼编码。
- 若要设计长短不等的编码,则必须是任一个字符的编码都不是另一个字符的编码的前缀,这种编码称为前缀编码。
四. 构造赫夫曼编码
- 用给定的若干字符的频度为权值生成赫夫曼树,并在每个叶子上注明对应的字符。
- 树中从根到每个叶子都有一条路径,对路径上的各分支约定指向左子树根的分支表示“0”码,指向右子树的分支表示“1”码,取每条路径上的“0”或“1”的序列作为和各个叶子对应的字符的编码,这就是赫夫曼编码。

五. 赫夫曼树和赫夫曼编码的存储表示
typedef struct{
unsigned int weight;
unsigned int parent,lchild,rchild;
}HTNode char *HuffmanTree;
typedef char * *HuffmanCode;
六. 求赫夫曼树和赫夫曼编码的算法
void HuffmanCoding(HuffmanTree &HT, HuffmanCode &HC, int *w, int n)
{
if(n<=1)
return ;
m=2*n-1;
HT=(HuffmanTree)malloc((m+1)*sizeof(HTNode));
for(p=HT, i=1; i<=n; ++i, ++p, ++w)
*p={*w,0,0,0};
for( ; i<=m; ++i, ++p)
*p={0,0,0,0};
for(i=n+1; i<=m; ++i)
{
Select(HT,i-1,s1,s2);
HT[s1].parent = i;
HT[s2].parent = i;
HT[i].lchild = s1;
HT[i].rchild = s2;
HT[i].weight = HT[s1].weight + HT[s2].weight;
}
Hc=(HuffmanTree)malloc((n+1)*sizeof(char * ));
cd=(char * )malloc(n * sizeof(char));
cd[n-1]="\0";
for(i=1; i<=n; ++i)
{
start=n-1;
for(c=i, f=HT[i].parent; f!=0; c=f, f=HT[f].parent)
{
if(HT[f].lchild == c)
cd[ - - start]="0";
else
cd[ - - start]="1";
}
HC[i]=(char * )malloc((n-start) * sizeof(char));
strcpy(HC[i],&cd[start]);
}
free(cd);
}