赫夫曼树和赫夫曼编码

#include <stdio.h>

#define MAXSIZE 128
//字符表
typedef struct {
    char ch;
    unsigned int repeat;
}table;

//哈夫曼树节点
typedef struct {
    char data;
    unsigned int weight;
    int  parent,lchild, rchild;
}hfmtree;

//哈夫曼编码
typedef struct {
    char data;
    char code[128];
}hfmcode;

hfmtree Hdata[2*MAXSIZE-1];
hfmcode code[MAXSIZE];
int count = 0;

void insrtch(char str[],char ch){//字符串首端插入字符
    int len = 0;
    while(str[len]!='\0'){
        len++;
    }
    str[len+1] = '\0';
    while(len!=0){
        str[len] = str[len-1];
        len--;
    }
    str[0] = ch;
}

int length(char *str){//求字符串长度
    int len = 0;
    while(str[0]!='\0'){
        len ++;
        str++;
    }
    return len;
}

int Getext(){//读文本文件,获取字符重复次数,存入字符表
    FILE *fp;
    int i,p;
    char buf;
    count = 0;
    table tb[MAXSIZE]={0};
    fopen_s(&fp,"d:\\text.txt","r");
    while(fread(&buf,1,1,fp)){
        printf("%c",buf);
        p = (int)buf;
        tb[p].ch = buf;
        (tb[p].repeat) ++;
    }
    fclose(fp);
    //赫夫曼森林种树
    for(i=0;i<MAXSIZE;i++){
        if(tb[i].repeat !=0){
            Hdata[count].data=tb[i].ch;
            Hdata[count].weight=tb[i].repeat;
            count++;
        }
    }
    //打印字符表
    printf_s("\nNow,Output the Text Table......\n");
    getchar();
    for(i=0;i<count;i++){
        printf("%d,%c,%u\n",i,Hdata[i].data,Hdata[i].weight);
    }
    return 0;
}

int BuildTree(){//建立哈夫曼树
    int i, j, k = 0;
    int reset = 0;
    int tnum = 0;
    int p1 = count;
    unsigned int  small = 65636 ;
    for (i=0;i<2*count-2 ;i++){
        for (j = 0; j < p1; j++){
            if(Hdata[j].parent==-1) tnum++;
            if ((Hdata[j].weight < small )&& (Hdata[j].parent == -1)) {
                small = Hdata[j].weight ;
                k = j;
            }
        }
        if (reset == 0){
            Hdata[p1].weight += Hdata[k].weight ;
            Hdata[p1].lchild = k;
            Hdata[k].parent = p1;
            reset = 1;
        }
        else{
            Hdata[p1].weight += Hdata[k].weight ;
            Hdata[p1].rchild = k;
            Hdata[k].parent = p1;
            reset = 0; 
            p1++;
        }
        if (tnum<2) break;
        tnum=0;
        small = 65636;
    }
    printf_s("\nNow,Output the Huffman Tree......\n");
    getchar();
    for(i=0;i<2*count-1;i++)
        printf("%d: %c,%u,%d,%d,%d\n",i,Hdata[i].data,Hdata[i].weight,Hdata[i].parent , Hdata[i].lchild,Hdata[i].rchild );
    return 0;
}

int Code(){//生成前缀编码
    int i;
    printf_s("\nNow,Output the Huffman Code......\n");
    getchar();
    int  c, p;                          
    for (i = 0; i < count; i++){
        code[i].data =  Hdata[i].data ;
        code[i].code[0] =  '\0' ;
        c = i;
        p = Hdata[c].parent;
        while (p != -1){
            if (Hdata[p].lchild == c) insrtch(code[i].code,'0');
            else insrtch(code[i].code,'1');
            c = p;
            p = Hdata[c].parent;
        }
    }
    for (i = 0; i < count; i++){
        printf("%c: %s\n",code[i].data,code[i].code);
    }
    return 0;
}

int Encode(){//对文本文件编码
    FILE *fpr,*fpw;
    int i;
    char ch ,*str;
    fopen_s(&fpr,"d:\\text.txt","r");
    fopen_s(&fpw,"d:\\code.txt","w");
    while(fread(&ch,sizeof(char),1,fpr)){
        for (i=0;i<count;i++){
            if(code[i].data == ch){
                str =  code[i].code;
                fwrite(str,sizeof(char),length(str),fpw);
                break;
            }
        }
    }
    printf("\n");
    fclose(fpr);
    fclose(fpw);
    return 0;
}

int Decode(){//文本文件存储的二进制码解码
    FILE *fp;
    int i,m;
    char buf;
    printf_s("\nNow,We can decode a binary string read from a text file......\n");
    getchar();
    fopen_s(&fp,"d:\\code.txt","r");
    m = 2*count- 1;
    i = m -1;
    while(fread(&buf,1,1,fp)){
        if (buf == '0') i = Hdata[i].lchild;
        else i = Hdata[i].rchild;

        if (Hdata[i].lchild == -1){
            printf_s("%c",Hdata[i].data);
            i = m -1;
        }
    }
    fclose(fp);
    printf_s("\nCongratulations! We Success !\n");
    return 0;
}

int main(){
    for(int i = 0;i<2*MAXSIZE-1;i++){//初始化赫夫曼树
        Hdata[i].data='0';
        Hdata[i].weight=0;
        Hdata[i].parent=-1;
        Hdata[i].lchild=-1;
        Hdata[i].rchild=-1;
    }

    Getext();//获得字符重复次数
    BuildTree();//建立赫夫曼二叉树,数组存储
    Code();//前缀编码
    Encode();//对一串文字进行编码,保存到文本文件
    Decode();//对输入的一个或一串编码进行解码
    getchar();
    return 0;
}
### 关于赫夫曼树赫夫曼编码 赫夫曼树是一种特殊的二叉树结构,其主要目的是实现数据压缩中的最优前缀码设计。通过构建赫夫曼树并生成对应的赫夫曼编码,可以有效地减少存储空间或传输带宽的需[^1]。 #### 赫夫曼树的核心概念 赫夫曼树也被称为最优二叉树,它基于贪心算法的思想来构造。该树的特点在于路径长度较短的节点具有更高的权重,而较长路径上的节点则对应较低的权重。这种特性使得赫夫曼树能够最小化加权路径长度(WPL),从而优化编码效率[^2]。 #### 构建赫夫曼树的过程 以下是创建赫夫曼树的主要逻辑: - 初始化一组叶子节点,每个节点代表输入字符及其频率。 - 将这些节点放入优先队列中,按照频率从小到大排列。 - 不断取出两个最低频率的节点,将其作为子节点创建一个新的父节点,新节点的频率等于两子节点之。 - 把这个新的父节点重新放回优先队列中。 - 重复上述过程直到只剩下一个根节点为止[^3]。 ```python import heapq from collections import defaultdict, namedtuple Node = namedtuple('Node', ['frequency', 'char', 'left', 'right']) def huffman_tree(frequencies): priority_queue = [] # 创建初始叶节点集合 for char, freq in frequencies.items(): leaf_node = Node(freq, char, None, None) heapq.heappush(priority_queue, (freq, leaf_node)) while len(priority_queue) > 1: low_freq_1, node_1 = heapq.heappop(priority_queue) low_freq_2, node_2 = heapq.heappop(priority_queue) merged_frequency = low_freq_1 + low_freq_2 internal_node = Node(merged_frequency, None, node_1, node_2) heapq.heappush(priority_queue, (merged_frequency, internal_node)) _, root = heapq.heappop(priority_queue) return root ``` #### 实现赫夫曼编码 一旦赫夫曼树被成功建立起来之后,就可以依据这棵树自动生成相应的赫夫曼编码表。具体方法是从根节点出发遍历整棵赫夫曼树,在向左移动时记录'0',而在右移过程中标记为'1'^[4]^。 ```python def generate_huffman_codes(node, current_code="", code_dict=None): if not code_dict: code_dict = {} if node.char is not None: code_dict[node.char] = current_code or "0" else: if node.left: generate_huffman_codes(node.left, current_code+"0", code_dict) if node.right: generate_huffman_codes(node.right, current_code+"1", code_dict) return code_dict ``` 关于头歌平台的学习资源推荐方面,可以通过搜索关键词“Huffman Tree”或者“Huffman Coding”,找到相关的在线编程实践题目以及教程视频等内容来进行深入学习巩固知识点[^5]。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值