数据结构复习之哈夫曼树及应用

最新推荐文章于 2024-05-13 09:31:39 发布

原创最新推荐文章于 2024-05-13 09:31:39 发布 · 1.6k 阅读

7 ·

CC 4.0 BY-SA版权

文章标签：

#数据结构 #算法

自学考试专栏收录该内容

224 篇文章

订阅专栏

本文详细介绍了哈夫曼树的概念及其构造方法，并通过实例展示了如何利用哈夫曼算法生成最优二叉树及哈夫曼编码。文章还探讨了哈夫曼树的特点及其在数据压缩中的应用。

哈夫曼树

哈夫曼树

最优二叉树,必考的内容，软考已经搞懂了，只是记录下。

哈夫曼树

概念

树的路径长度

从树根到树中每一结点的路径长度之和。在结点数目相同的二叉树中，完全二叉树的路径长度最短。

带权路径长度wpl

结点的权：在一些应用中，赋予树中结点的一个有某种意义的实数。

结点的带权路径长度：结点到树根之间的路径长度与该结点上权的乘积。

树的带权路径长度(WPL)：定义为树中所有叶结点的带权路径长度之和。

哈夫曼树

带权路径长度WPL最小的二叉树称为最优二叉树或哈夫曼树。

哈夫曼算法

构造哈夫曼树方法

步骤：
① 将给定的权值按照从小到大排列成｛W1，W2，…，Wm｝，并且构造出树林F=｛Tl，T2，…，Tm｝。此时，其中的每棵树Ti (1≤i≤m）为左、右子树均为空的二叉树，二叉树的根结点的权值为Wi 。

② 把F中树根结点的权值最小的两棵二叉树T1和T2合并为一棵新的二叉树T（T的左子树为T1，右子树为T2），并令T的根结点的权值为T1和T2的根结点的权值之和，然后将T按其根结点的权值大小依次加入到树林F中。同时，从F中删去T1和T2这两棵二叉树。简言之，找两个最小的，合成一个,就删除这两个数，将合成的再加入到森林中，再找最小的两个合成一棵树…

③ 重复步骤②，直到构造成一棵哈夫曼树。

哈夫曼树的特点

① 在哈夫曼树中，权值越大的叶子离根结点越近。
② 若有n0个权值，需要进行n0-1次合并，构造成为哈夫曼树。
③ 哈夫曼树没有度为1的结点。
④ 由n0个权值构成的哈夫曼树，叶结点数为n0，度为2的结点数为 n0-1（二叉树的性质3），结点总数为n0+ n2= n0+ n0-1=2n0-1。
⑤ 给定一组权值，构造出的哈夫曼树的形态可能不唯一，但它们的带权路径长度都一样。

哈夫曼编码

编码和解码

数据压缩过程称为编码。即将文件中的每个字符均转换为一个唯一的二进制位串。

数据解压过程称为解码。即将二进制位串转换为对应的字符。

前缀码方案

对字符集进行编码时，要求字符集中任一字符的编码都不是其它字符的编码的前缀，这种编码称为前缀(编)码。设有abcd需要编码表示（其中，a=0、b=10、c=110、d=11,则110的前缀表示的可以是c或者是d跟a，出现这种情况是因为d的前缀11与c的前缀110有重合部分，这个是关键。）
等长编码：最常见的就是 ASSIC 编码，8位等长的二进制0-127来表示字符。可以预见，任何一个等长编码的字符，不可能是另一个字符的前缀，所以等长编码是前缀码。