从树中一个节点到另一个节点自己的分支构成两个节点之间的路径,路径上的分支数目称做路径长度。树的路径长度就是从树的根节点到每一个节点的长度之和。
假设一颗有N个节点的二叉树,每个叶子节点都带权值wk,每个叶子节点的路径长度为lk。我们称带权路径长度WPL最小的二叉树称做huffman树(最优二叉树)。
huffman树的构造方法:
1、根据k个权值{w1,w2,...,wk},生成k颗只有根结点,没有左右子树的二叉树的集合F{T1,T2,。。,Tk},其中每颗树的根节点都有一个权值wi。
2、在F中选取两颗根节点的权值最小的树作为左右子树构造一颗新的二叉树。两颗子树,权值小的为左子树,大的为右子树。新的二叉树的权值为两颗树的权值之和。
3、将2步选取的两颗树在F中删除,并将新二叉树加入F中。
4、重复2,3步,直到F中只有一颗树为止。
代码实现的时候,集合F最好用最小堆来存储待合并的带权值的二叉树。由于到现在为止还未讲到堆,把实现部分放到TODO 中吧。
<

本文介绍了Huffman树的概念,包括最小带权路径长度和构造方法。通过构建Huffman树进行数据压缩,重点阐述了压缩过程,包括字符出现频率计算、Huffman树构造、字符编码以及如何确保编码的唯一性。Huffman编码是一种有效的数据压缩手段,其解压过程依赖于固定编码对应原字符的反向查找。
最低0.47元/天 解锁文章
6035

被折叠的 条评论
为什么被折叠?



