先回忆一下什么是哈夫曼树
下面是一个基本的利用最小堆生成哈夫曼树的步骤:
-
创建最小堆:将所有的权重作为节点构建成最小堆。
-
从最小堆中取出两个权值最小的节点,并合并为一个新节点,新节点的权值为这两个节点的权值之和。
-
将新节点插入最小堆中。
-
重复步骤2和3,直到最小堆中只剩下一个节点为止,这个节点就是哈夫曼树的根节点。
你现在大概有印象了吧!那现在我们讨论一下什么是哈夫曼编码:
这是一种常用的变长编码方式,它通过构建哈夫曼树来实现对字符集中每个字符的编码,以便在数据传输和存储时能够有效地压缩信息。
下面是生成哈夫曼编码的基本步骤:
-
统计字符频率:首先需要统计待编码的字符集中每个字符出现的频率。
-
构建哈夫曼树:根据字符频率构建哈夫曼树,该树是一种特殊的二叉树,其叶子节点代表字符,而非叶子节点不包含字符。
-
生成编码:从根节点开始,沿着左子树走为0,右子树走为1,直到到达叶子节点,记录下路径上的0和1,即为字符的哈夫曼编码。
#include <stdio.h>
#define n 5
typedef struct {
int weight;
int parent, lchild, rchild;
}Elemtype;
char ch[n] = { 'A','B','C','D','E' };
int w[n] = { 35,25,15,15,10 };
//找到两个权重最小且没有父节点的节点
void select(Elemtype huffmanaTree[], int k, int *i1, int *i2) {
// 定义两个最小值
int min1 = 100;//第一小
int min2 = 100;//第二小
int i;
for (i = 0; i < k; i++) { // 遍历数组
if (huffmanaTree[i].parent == -1) { // 找到还没有父节点的节点
/*if节点的权重比min1小,则将min1更新为该节点的权重值,
同时将min2更新为原来的min1,然后让自己的下标=i1为该节点的下标,
表示当前最小的节点位置。如果节点的权重介于min1和min2之间,
则将min2更新为该节点的权重值,同时更新i2为该节点的下标。*/
if (huffmanaTree[i].weight < min1) { // 如果该节点权值<min1
min2 = min1; // 更新min1
*i2 = *i1; // 将原来的min1赋值给i2
min1 = huffmanaTree[i].weight; // 更新min1
*i1 = i; // 将该节点下标赋值给i1
}
//就是3 5 1;当第二次的时候if不会要5,让min2要
else if (huffmanaTree[i].weight < min2) {//如果 >min1&&<min2
min2 = huffmanaTree[i].weight; // 更新min2
*i2 = i; // 将该节点下标赋值给i2
}
}
}
}
void HumffmanTree(Elemtype huffTree[])
{
int i, k, i1, i2;
for (i = 0; i < 2 * n - 1; i++) {//合并有2n-1个节点,然后初始化
huffTree[i].lchild = -1;
huffTree[i].parent = -1;
huffTree[i].rchild = -1;
}
for (i = 0; i < n; i++)
huffTree[i].weight = w[i];
//然后将它们合并为一个新节点,新节点的权重是这两个节点的权重之和。
for (k = n; k < 2 * n - 1; k++) {
select(huffTree, k, &i1, &i2);
huffTree[k].weight = huffTree[i1].weight + huffTree[i2].weight;
huffTree[i1].parent = k;
huffTree[i2].parent = k;//索引
huffTree[k].lchild = i1; huffTree[k].rchild = i2;
}
}
/*它从树的每个叶子节点开始,沿着树向上移动到根节点,
途中记录从根到叶子的路径,从而形成该字符的编码。*/
void Huffmancode(Elemtype huffTree[]) {
int i, j, k;
int s[n], top = -1;
for (i = 0; i < n; i++) {
printf("字符%c的编码是: ", ch[i]);
k = i;///当前字符的索引
while (huffTree[k].parent != -1) {
j = huffTree[k].parent;//取当前节点的父节点索引。
if (huffTree[j].lchild == k)
s[++top] = 0;
else//huffTree[j].rchild == k
s[++top] = 1;
k = j;//更新向上
}
//出栈
while (top != -1)
printf("%d", s[top--]);
printf("\n");
}
}
int main() {
Elemtype huffTree[2 * n - 1];
HumffmanTree(huffTree);
Huffmancode(huffTree);
}