哈夫曼树分析

哈夫曼树是一种带权路径长度最短的二叉树,常用于数据压缩和编码。虽然通常被称为二叉树,但理论上可以是多叉树。构建哈夫曼树时,通过不断合并权值最小的节点,直到所有节点合并成一棵树。在编码过程中,权重较小的元素离根节点更远,确保编码唯一性。由于数据只存在于叶子节点,从根到叶子的路径唯一,避免了编码冲突。

给定N个权值作为N个叶子节点,构造一棵二叉树,若该树的带权路径长度达到最小,称这样的二叉树为最优二叉树,也称为哈夫曼树(Huffman Tree)。哈夫曼树是带权路径长度最短的树,权值较大的结点离根较近。

这是百度搜素给的定义,从严格意义上来说哈夫曼树并不是二叉的而是多叉的,二叉树只是一种形式也是最常见的形式。这一点在百度搜素中也有注明,只是需要做一下调整,构造哈夫曼树的思想是每次选k个权重最小的元素来合成一个新的元素,该元素权重为k个元素权重之和。但是当k大于2时,按照这个步骤做下去可能到最后剩下的元素少于k个。解决这个问题的办法是假设已经有了一棵哈夫曼树(且为一棵满k叉树),则可以计算出其叶节点数目为(k-1)nk+1,式子中的nk表示子节点数目为k的节点数目。于是对给定的n个权值构造k叉哈夫曼树时,可以先考虑增加一些权值为0的叶子节点,使得叶子节点总数为(k-1)nk+1这种形式,然后再按照哈夫曼树的方法进行构造即可。

那么为什么哈夫曼树会让编码唯一呢?

我们每次构建的时候会发现父节点都不是数据构成的,那么也就是说所有的数据都存放在叶子节点中,对于每个数据而言从顶点到它的路径上是不会有任何数据的也就保证了路径的唯一性。

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值