最小堆之哈夫曼树编码

先回忆一下什么是哈夫曼树

下面是一个基本的利用最小堆生成哈夫曼树的步骤:

  1. 创建最小堆:将所有的权重作为节点构建成最小堆。

  2. 从最小堆中取出两个权值最小的节点,并合并为一个新节点,新节点的权值为这两个节点的权值之和。

  3. 将新节点插入最小堆中。

  4. 重复步骤2和3,直到最小堆中只剩下一个节点为止,这个节点就是哈夫曼树的根节点。

 你现在大概有印象了吧!那现在我们讨论一下什么是哈夫曼编码:

        这是一种常用的变长编码方式,它通过构建哈夫曼树来实现对字符集中每个字符的编码,以便在数据传输和存储时能够有效地压缩信息。

下面是生成哈夫曼编码的基本步骤:

  1. 统计字符频率:首先需要统计待编码的字符集中每个字符出现的频率。

  2. 构建哈夫曼树:根据字符频率构建哈夫曼树,该树是一种特殊的二叉树,其叶子节点代表字符,而非叶子节点不包含字符。

  3. 生成编码:从根节点开始,沿着左子树走为0,右子树走为1,直到到达叶子节点,记录下路径上的0和1,即为字符的哈夫曼编码。

#include <stdio.h>
#define n 5

typedef struct {
	int weight;
	int parent, lchild, rchild;
}Elemtype;

char ch[n] = { 'A','B','C','D','E' };
int w[n] = { 35,25,15,15,10 };
//找到两个权重最小且没有父节点的节点
void select(Elemtype huffmanaTree[], int k, int *i1, int *i2) {
	// 定义两个最小值
	int min1 = 100;//第一小
	int min2 = 100;//第二小
	int i;
	for (i = 0; i < k; i++) {  // 遍历数组
		if (huffmanaTree[i].parent == -1) {  // 找到还没有父节点的节点

			/*if节点的权重比min1小,则将min1更新为该节点的权重值,
			同时将min2更新为原来的min1,然后让自己的下标=i1为该节点的下标,
			表示当前最小的节点位置。如果节点的权重介于min1和min2之间,
			则将min2更新为该节点的权重值,同时更新i2为该节点的下标。*/

			if (huffmanaTree[i].weight < min1) {  // 如果该节点权值<min1
				min2 = min1;  // 更新min1
				*i2 = *i1;  // 将原来的min1赋值给i2
				min1 = huffmanaTree[i].weight;  // 更新min1
				*i1 = i;  // 将该节点下标赋值给i1
			}
			//就是3 5 1;当第二次的时候if不会要5,让min2要
			else if (huffmanaTree[i].weight < min2) {//如果 >min1&&<min2
				min2 = huffmanaTree[i].weight;  // 更新min2
				*i2 = i;  // 将该节点下标赋值给i2
			}
		}
	}
}

void HumffmanTree(Elemtype huffTree[])
{
	int i, k, i1, i2;
	for (i = 0; i < 2 * n - 1; i++) {//合并有2n-1个节点,然后初始化
		huffTree[i].lchild = -1;
		huffTree[i].parent = -1;
		huffTree[i].rchild = -1;
	}
	for (i = 0; i < n; i++)
		huffTree[i].weight = w[i];
//然后将它们合并为一个新节点,新节点的权重是这两个节点的权重之和。
	for (k = n; k < 2 * n - 1; k++) {
		select(huffTree, k, &i1, &i2);
		huffTree[k].weight = huffTree[i1].weight + huffTree[i2].weight;
		huffTree[i1].parent = k;
		huffTree[i2].parent = k;//索引
		huffTree[k].lchild = i1; huffTree[k].rchild = i2;
	}
}
/*它从树的每个叶子节点开始,沿着树向上移动到根节点,
途中记录从根到叶子的路径,从而形成该字符的编码。*/
void Huffmancode(Elemtype huffTree[]) {
	int i, j, k;
	int s[n], top = -1;
	for (i = 0; i < n; i++) {
		printf("字符%c的编码是: ", ch[i]);
		k = i;///当前字符的索引
		while (huffTree[k].parent != -1) {
			j = huffTree[k].parent;//取当前节点的父节点索引。

			if (huffTree[j].lchild == k)
				s[++top] = 0;
			else//huffTree[j].rchild == k
				s[++top] = 1;

			k = j;//更新向上
		}
		//出栈
		while (top != -1)
			printf("%d", s[top--]); 

		printf("\n");
	}
}
int main() {
	Elemtype huffTree[2 * n - 1];
	HumffmanTree(huffTree);
	Huffmancode(huffTree);
}
最小是一种特殊的二叉,它满足以下性质: 1. 每个节点的值都小于或等于其子节点的值。 2. 中的最小元素位于根节点。 哈夫曼是一种用于数据压缩的形结构,它通过将出现频率较高的字符编码为较短的二进制码,从而实现数据的高效压缩。构建哈夫曼的过程中,需要使用最小来选择频率最低的两个节点进行合并。 下面是使用C语言实现最小构建哈夫曼的基本步骤: 1. 定义一个结构体来表示节点,包括字符、频率和左右子节点等信息。 ```c struct Node { char data; int freq; struct Node* left; struct Node* right; }; ``` 2. 创建一个最小,并初始化为空。 ```c struct MinHeap { int size; int capacity; struct Node** array; }; ``` 3. 实现最小的一些基本操作,如交换节点、调整节点位置等。 ```c void swapNode(struct Node** a, struct Node** b); void minHeapify(struct MinHeap* minHeap, int index); struct Node* extractMin(struct MinHeap* minHeap); void insertMinHeap(struct MinHeap* minHeap, struct Node* node); ``` 4. 构建最小,将每个字符的频率作为节点的值,并插入到最小中。 ```c struct MinHeap* createAndBuildMinHeap(char data[], int freq[], int size); ``` 5. 构建哈夫曼,不断从最小中取出频率最低的两个节点,合并为一个新节点,并将新节点插入到最小中,直到最小中只剩下一个节点为止。 ```c struct Node* buildHuffmanTree(char data[], int freq[], int size); ``` 6. 打印哈夫曼编码,通过遍历哈夫曼的路径来获取每个字符的编码。 ```c void printCodes(struct Node* root, int arr[], int top); ``` 这是一个简单的介绍,如果你需要更详细的代码实现或者有其他问题,请告诉我。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值