排序输入的高效霍夫曼编码 示例图
建议先阅读下面的文章:
c语言:c语言 霍夫曼编码 | 贪婪算法(Huffman Coding | Greedy Algo)_霍夫曼的贪婪c语言-优快云博客
c++:c++ 霍夫曼编码 | 贪婪算法(Huffman Coding | Greedy Algo)_霍夫曼的贪婪算法设计核心代码-优快云博客
c#:C# 霍夫曼编码 | 贪婪算法(Huffman Coding | Greedy Algo)-优快云博客
c++ STL:c++ STL 霍夫曼编码 | 贪婪算法(Huffman Coding | Greedy Algo)-优快云博客
java:java 霍夫曼编码 | 贪婪算法(Huffman Coding | Greedy Algo)-优快云博客
python:python 霍夫曼编码 | 贪婪算法(Huffman Coding | Greedy Algo)-优快云博客
javascript:JavaScript 霍夫曼编码 | 贪婪算法(Huffman Coding | Greedy Algo)-优快云博客
上面讨论的算法的时间复杂度是 O(nLogn)。如果我们知道给定的数组是排好序的(按频率非递减顺序),我们可以在 O(n) 时间内生成霍夫曼码。以下是针对已排序输入的 O(n) 算法。
1.创建两个空队列。
2.为每个唯一字符创建一个叶节点,并按频率非递减顺序将其入队到第一个队列。最初第二个队列是空的。
3.通过检查两个队列的前面,使两个频率最小的节点出队。重复以下步骤两次
1. 如果第二个队列为空,则从第一个队列出队。
2. 如果第一个队列为空,则从第二个队列出队。
3. 否则,比较两个队列的前面,并使最小的节点出队。
4.创建一个新的内部节点,其频率等于两个节点频率之和。将第一个出队节点设为其左子节点,将第二个出队节点设为右子节点。将此节点入队到第二个队列。
5.重复步骤 3 和 4,直到队列中有多个节点。剩下的节点就是根节点,树就完成了。
示例代码:
//// java Program for Efficient Huffman Coding for Sorted input //
import java.util.PriorityQueue;
import java.util.HashMap;
// Node structure for creating a binary tree //
class Node {
char ch;
int freq;
Node left;
Node right;
Node(char c, int f) {
ch = c;
freq = f;
left = null;
right = null;
}
}
public class Main {
// Function to print the generated Huffman codes
static void printHuffmanCodes(Node root, String str) {
if (root == null)
return;
if (root.ch != '$') {
System.out.println(root.ch + ": " + str);
return;
}
printHuffmanCodes(root.left, str + "0");
printHuffmanCodes(root.right, str + "1");
}
// Function to generate Huffman codes
static void generateHuffmanCode(HashMap<Character, Integer> charFreq) {
if (charFreq.isEmpty())
return;
PriorityQueue<Node> pq = new PriorityQueue<>((a, b) -> a.freq - b.freq);
for (char c : charFreq.keySet()) {
pq.add(new Node(c, charFreq.get(c)));
}
while (pq.size() > 1) {
Node left = pq.poll();
Node right = pq.poll();
Node node = new Node('$', left.freq + right.freq);
node.left = left;
node.right = right;
pq.add(node);
}
printHuffmanCodes(pq.poll(), "");
}
public static void main(String[] args) {
HashMap<Character, Integer> charFreq = new HashMap<>();
charFreq.put('a', 5);
charFreq.put('b', 9);
charFreq.put('c', 12);
charFreq.put('d', 13);
charFreq.put('e', 16);
charFreq.put('f', 45);
generateHuffmanCode(charFreq);
}
}
输出:
f: 0
c: 100
d: 101
a: 1100
b: 1101
e: 111
时间复杂度: O(n)
如果输入未排序,则需要先对其进行排序,然后才能通过上述算法进行处理。排序可以使用堆排序或合并排序来完成,两者都在 Theta(nlogn) 中运行。因此,对于未排序的输入,总体时间复杂度变为 O(nlogn)。
辅助空间: O(n)