对小甲鱼哈弗曼树代码的小修改

这篇博客详细介绍了如何实现哈弗曼树,包括读取文档、建立最小生成树、构建编码表以及编码和解码的过程。作者通过示例代码讲解了关键函数的功能,如read_file、buildTree、buildTable等,帮助读者理解哈弗曼编码的原理。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

只是记录一下自己写作业的过程,我不是一个程序员,我是一个想进德云社的闲散人员
一.自己对huffman树的理解
先用程序读入一篇或多篇英文文章,把文章中出现的每一个字符都当做树结构中的一个节点,并且给每个节点附上一个权值(该字符在文章中出现的次数),通过这些权值,构成最小生成树。这就是huffman树的建立过程。最小生成树建立好以后,每个字符都会有一个由二进制数构成的编码,可以根据这些编码对一串二进制树解码,把二进制数还原成字符。具体内容会在程序中讲解。

二.程序讲解

# include <stdio.h>
# include <stdlib.h>
# include "huffman.h"

int main()
{
    char *rf = read_file("1.txt");//读入文档内容
    htTree * codeTree = buildTree(rf);//建立huffman树
    hlTable *codeTable = buildTable(codeTree);//建立编码表
    char *enco = read_file("encode.txt");
    char* deco = encode(codeTable,enco);//对读入字符串编码
    decode(codeTree,deco);对读入字符串解码
    return 0;
}

1.read_file函数讲解
上面已经提到过huffman就是通过读入一写字符,根据每个字符的出现次数生成最小生成树,那么如何读入字符内容呢。我选择从txt文档里读入。先看一下这个函数的代码吧

char* read_file(char *fname)
{
    FILE*fp = fopen(fname,"rb");
    char arr[100][256];
    char *str;
    int len=0;
    int i=0;
    while(fgets(arr[i],256,fp)!=NULL)
      {
           i++;
      }
    fclose(fp);
    str = (char*)malloc(sizeof(char)*256*(i));
    memset(str,0,sizeof(char)*256*(i));
    for(int j=1;j<=i;j++)
    {
        strcat(str,arr[j-1]);
    }
    return str;
}

这里需要思考的一个问题是如何读入多行文档。用fgets函数可以很好解决。根据我个人了解,fgets函数每次都能读入一行文档,如果文档有多行,再次使用fgets函数读取文档时,就会读取下一行。直到 fgets(arr[i],256,fp)!=NULL的时候,说明多行文档已经读入完毕。每次读取一行内容的时候都会存到二维数组arr中。fgets函数会自动在第一个参数数组的末尾加上结束符’\0’.
于此同时通过i++,来得到当行文档总共有多少行。一次来获得要存入全部文档总共需要的一个大概内存。(char*)malloc(sizeof(char)256(i)),假设每行有256个字符,在这里肯定会浪费一些空间,这里就留给你们去修改。然后通过memset初始化字符串空间。
然后吧文档的每行内容存到str指向的空间。这样就完成了对当行字符的读入并用一个指针指向这些字符内容,并返回。

2.buildTree函数内容讲解

htTree * buildTree(char *inputString)//建立Huffman树
{

        int *probablity = (int*)malloc(sizeof(int)*256);//整数数组
    for(int i=0;i<256;i++)
    {
        probablity[i]=0;//整数数组初始化
    }
    for(int j=0;inputString[j]!='\0';j++)
    {
        probablity[(unsigned int)inputString[j]]++;//当读入的字符串不结束时,一直循环,对应ascall编码的整数下标的数组元素+1
    }//出现次数用作权值

    pQueue * huffmanqueue = NULL; 
    huffmanqueue = iniPQueue(huffmanqueue);//生成并初始化huffamn树队列

    for(int k=0;k<256;k++)
    {
        if(probablity[k]!=0)//!=0说明k整数对应的ascal
道01数据结构算法绪论. mp402_谈谈算法. mp4 西03_时间复杂度和空间复杂度.mp404_时间复杂度和空间复杂度2.mp405_时间复杂度和空间复杂度3.mp4险06线性表. mp407_线性表2. mp408_线性表3. mp4品09_ 线性表4. mp410_线性表5. mp411_线性表6. mp4@12_线性表7. mp413_线性表8. mp4西14. 线性表9. mp415_线性表10. mp4 16_单链表小结:腾讯面试题. mp4品17_ 线性表12. mp418_约瑟夫问题. mp4西19_ 线性表14. mp4 20_魔术师发牌问题. mp421线性表16. mp4逾22_ 线性表17. mp423_栈和队列. mp424_栈和队列2. mp4面25_ 进制转换. mp4面26_ 栈和队列4. mp427_逆波兰计算器mp4 28_中缀表达式转换为后缀表达式01. mp4逾29_ 中缀表达式转换为后缀表达式02. mp430_栈和队列7. mp431_栈和队列8. mp4 西32递归和分治思想.mp433_递归和分治思想2. mp434_汉诺塔. mp4 35_八皇后问题. mp4 四36_字符串.mp4 二37_ KMP算法. mp4 四71斐波那契查找(黄金分割法查找).38_ KMP算法2. mp4 立39_ KMP算法之NEXT数组代码原理分析. mp4二40_ KMP算法之实现及优化. mp4二41. mp4 四42_的存储结构. mp443_的存储结构2. mp4四44_二艾. mp445_二叉2. mp4 46_二又的存数结构. mp447_二又的遍历. mp4 48_二丈的建立和遍历算法. mp4四49_线索二叉. mp4 50_线索二又代码实现. mp4 画51_、森林及二又的相互转换. mp452_赫夫曼树. mp453_赫夫曼编码. mp4 四54_赫夫曼编码C语言实现. mp4口55_图. mp4 逾56_图的定义与术语2. mp457_图的存储结构. mp4 58_图的存储结构(邻接表) . mp4 59_图的存储结构(十字链表、邻接多重表、边集数组) . mp4四93堆排序的代码实现mp460_图的遍历(深度优先遍历) . mp4 品94归并排序. mp4 四61_马踏棋盘算法(骑士周游问题) . mp4 95归并排序(迭代实现) . mp4品62_图的遍历(广度优先遍历) . mp4 國96快速排序.mp4 63_最小生成(普里姆算法) . mp4 二97快速排序的优化mp464_最小生成( 克鲁斯卡尔算法) . mp4 立98总结回顾.mp4画65_最短路径(迪杰斯特拉算法).mp466_最短路径( 弗洛伊德算法) . mp4口67拓扑排序. mp4二68关键路径.mp4口69_查找算法. mp4 画69关键路径(代码讲解).mp4
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值