1.什么是哈夫曼树和哈弗曼编码
大家来看这样一道面试题(题目来自于<程序员面试宝典>)。用二进制来编码字符串"abcdabaa",需要能够根据编码,解码回原来的字符串,最少需要多长的二进制字符串?
A.12 B.14 C.18 D.24
解析:典型的哈弗曼编码问题:字符串"abcdabaa"有4个a、2个b、1个c、1个d。构造哈弗曼树如下图所示(图好丑)。a编码0(1位),b编码10(2位),d编码111(3位)。二进制字符串的总长度为1*4+2*2+3*1+3*1。
接下来让我们一同回顾哈弗曼树的理论知识吧。在一般的数据结构的书中,树的那章后面,著者一般都会介绍一下哈夫曼(HUFFMAN)树和哈夫曼编码。哈夫曼编码是哈夫曼树的一个应用。哈夫曼编码应用广泛,如JPEG中就应用了哈夫曼编码。 首先介绍什么是哈夫曼树。哈夫曼树又称最优二叉树,是一种带权路径长度最短的二叉树。所谓树的带权路径长度,就是树中所有的叶结点的权值乘上其到根结点的 路径长度(若根结点为0层,叶结点到根结点的路径长度为叶结点的层数)。树的带权路径长度记为WPL= (W1*L1+W2*L2+W3*L3+...+Wn*Ln),N个权值Wi(i=1,2,...n)构成一棵有N个叶结点的二叉树,相应的叶结点的路径长度为Li(i=1,2,...n)。可以证明哈夫曼树的WPL是最小的。名字解释: