前缀代码是指以一种方式分配代码(位序列),使得分配给一个字符的代码不是分配给任何其他字符的代码的前缀。这就是霍夫曼编码确保解码生成的比特流时没有歧义的方式。
霍夫曼编码主要包括两个主要部分:
1)根据输入字符构建霍夫曼树。
2)遍历霍夫曼树并将代码分配给字符。
构建霍夫曼树的步骤
输入是权重组成的数组,然后输出霍夫曼树。
1.为每个权重创建一个叶节点,并为所有叶节点建立一个最小堆(Min Heap用作优先级队列。weight的值用于比较最小堆中的两个节点。初始化时,最小权重的节点是根节点)
2.从最小堆中提取权重最小的两个节点。
3.创建一个权重等于两个节点权重之和的新内部节点。使第一个提取的节点为其左子节点,另一个提取的节点为其右子节点。将此节点添加到最小堆中。
4.重复步骤2和3,直到堆仅包含一个节点。这个节点是根节点