最小堆之哈夫曼树编码

先回忆一下什么是哈夫曼树

下面是一个基本的利用最小堆生成哈夫曼树的步骤:

  1. 创建最小堆:将所有的权重作为节点构建成最小堆。

  2. 从最小堆中取出两个权值最小的节点,并合并为一个新节点,新节点的权值为这两个节点的权值之和。

  3. 将新节点插入最小堆中。

  4. 重复步骤2和3,直到最小堆中只剩下一个节点为止,这个节点就是哈夫曼树的根节点。

 你现在大概有印象了吧!那现在我们讨论一下什么是哈夫曼编码:

        这是一种常用的变长编码方式,它通过构建哈夫曼树来实现对字符集中每个字符的编码,以便在数据传输和存储时能够有效地压缩信息。

下面是生成哈夫曼编码的基本步骤:

  1. 统计字符频率:首先需要统计待编码的字符集中每个字符出现的频率。

  2. 构建哈夫曼树:根据字符频率构建哈夫曼树,该树是一种特殊的二叉树,其叶子节点代表字符,而非叶子节点不包含字符。

  3. 生成编码:从根节点开始,沿着左子树走为0,右子树走为1,直到到达叶子节点,记录下路径上的0和1,即为字符的哈夫曼编码。

#include <stdio.h>
#define n 5

typedef struct {
	int weight;
	int parent, lchild, rchild;
}Elemtype;

char ch[n] = { 'A','B','C','D','E' };
int w[n] = { 35,25,15,15,10 };
//找到两个权重最小且没有父节点的节点
void select(Elemtype huffmanaTree[], int k, int *i1, int *i2) {
	// 定义两个最小值
	int min1 = 100;//第一小
	int min2 = 100;//第二小
	int i;
	for (i = 0; i < k; i++) {  // 遍历数组
		if (huffmanaTree[i].parent == -1) {  // 找到还没有父节点的节点

			/*if节点的权重比min1小,则将min1更新为该节点的权重值,
			同时将min2更新为原来的min1,然后让自己的下标=i1为该节点的下标,
			表示当前最小的节点位置。如果节点的权重介于min1和min2之间,
			则将min2更新为该节点的权重值,同时更新i2为该节点的下标。*/

			if (huffmanaTree[i].weight < min1) {  // 如果该节点权值<min1
				min2 = min1;  // 更新min1
				*i2 = *i1;  // 将原来的min1赋值给i2
				min1 = huffmanaTree[i].weight;  // 更新min1
				*i1 = i;  // 将该节点下标赋值给i1
			}
			//就是3 5 1;当第二次的时候if不会要5,让min2要
			else if (huffmanaTree[i].weight < min2) {//如果 >min1&&<min2
				min2 = huffmanaTree[i].weight;  // 更新min2
				*i2 = i;  // 将该节点下标赋值给i2
			}
		}
	}
}

void HumffmanTree(Elemtype huffTree[])
{
	int i, k, i1, i2;
	for (i = 0; i < 2 * n - 1; i++) {//合并有2n-1个节点,然后初始化
		huffTree[i].lchild = -1;
		huffTree[i].parent = -1;
		huffTree[i].rchild = -1;
	}
	for (i = 0; i < n; i++)
		huffTree[i].weight = w[i];
//然后将它们合并为一个新节点,新节点的权重是这两个节点的权重之和。
	for (k = n; k < 2 * n - 1; k++) {
		select(huffTree, k, &i1, &i2);
		huffTree[k].weight = huffTree[i1].weight + huffTree[i2].weight;
		huffTree[i1].parent = k;
		huffTree[i2].parent = k;//索引
		huffTree[k].lchild = i1; huffTree[k].rchild = i2;
	}
}
/*它从树的每个叶子节点开始,沿着树向上移动到根节点,
途中记录从根到叶子的路径,从而形成该字符的编码。*/
void Huffmancode(Elemtype huffTree[]) {
	int i, j, k;
	int s[n], top = -1;
	for (i = 0; i < n; i++) {
		printf("字符%c的编码是: ", ch[i]);
		k = i;///当前字符的索引
		while (huffTree[k].parent != -1) {
			j = huffTree[k].parent;//取当前节点的父节点索引。

			if (huffTree[j].lchild == k)
				s[++top] = 0;
			else//huffTree[j].rchild == k
				s[++top] = 1;

			k = j;//更新向上
		}
		//出栈
		while (top != -1)
			printf("%d", s[top--]); 

		printf("\n");
	}
}
int main() {
	Elemtype huffTree[2 * n - 1];
	HumffmanTree(huffTree);
	Huffmancode(huffTree);
}
### 如何使用最小构建哈夫曼 构建哈夫曼的核心思想是利用贪心算法,通过最小(优先队列)选择频率最低的两个节点进行合并,直到所有节点合并为一棵。以下是实现该过程的详细说明和代码示例。 #### 构建哈夫曼的步骤 1. 初始化:将每个字符及其频率作为单独的节点插入到最小中。 2. 合并操作:从中取出频率最小的两个节点,创建一个新的内部节点,其频率为这两个节点频率之和,并将新节点重新插入中。 3. 重复上述操作,直到中只剩下一个节点,即为哈夫曼的根节点。 #### 示例代码 以下是一个使用 C++ 实现的哈夫曼构建代码: ```cpp #include <iostream> #include <queue> #include <vector> #include <string> #include <unordered_map> using namespace std; // 定义哈夫曼节点结构 struct HuffmanNode { char character; // 字符 int frequency; // 频率 HuffmanNode* left; // 左子节点 HuffmanNode* right; // 右子节点 HuffmanNode(char c, int f) : character(c), frequency(f), left(nullptr), right(nullptr) {} }; // 自定义比较函数,用于最小 struct Compare { bool operator()(HuffmanNode* l, HuffmanNode* r) { return l->frequency > r->frequency; } }; // 打印哈夫曼编码 void printHuffmanCodes(HuffmanNode* root, string str) { if (!root) return; if (root->left == nullptr && root->right == nullptr) { cout << root->character << ": " << str << endl; } printHuffmanCodes(root->left, str + "0"); printHuffmanCodes(root->right, str + "1"); } // 构建哈夫曼 HuffmanNode* buildHuffmanTree(const unordered_map<char, int>& freqMap) { priority_queue<HuffmanNode*, vector<HuffmanNode*>, Compare> minHeap; // 将每个字符及其频率加入最小 for (const auto& pair : freqMap) { minHeap.push(new HuffmanNode(pair.first, pair.second)); } // 不断合并中的节点 while (minHeap.size() != 1) { HuffmanNode* left = minHeap.top(); minHeap.pop(); HuffmanNode* right = minHeap.top(); minHeap.pop(); HuffmanNode* merged = new HuffmanNode('\0', left->frequency + right->frequency); merged->left = left; merged->right = right; minHeap.push(merged); } return minHeap.top(); } int main() { // 输入字符及其频率 unordered_map<char, int> freqMap = { {'A', 45}, {'B', 13}, {'C', 12}, {'D', 16}, {'E', 9}, {'F', 5} }; // 构建哈夫曼 HuffmanNode* root = buildHuffmanTree(freqMap); // 输出哈夫曼编码 cout << "Huffman Codes:" << endl; printHuffmanCodes(root, ""); return 0; } ``` #### 代码解释 - **HuffmanNode 结构**:表示哈夫曼的节点,包含字符、频率以及左右子节点指针。 - **Compare 结构**:用于定义最小的比较规则,确保频率较低的节点优先级更高。 - **buildHuffmanTree 函数**:根据输入的频率表构建哈夫曼。 - **printHuffmanCodes 函数**:递归遍历哈夫曼,输出每个字符对应的编码[^4]。 ### 注意事项 在实际应用中,为了节省存储空间,可以将哈夫曼编码结果保存为二进制文件或字符串形式。此外,如果需要处理大量数据,可以考虑优化内存管理以避免过多的动态分配[^1]。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值