哈夫曼树实现文件的压缩与解压缩

本文介绍了如何使用哈夫曼树进行文件的压缩与解压缩。首先,统计文件中字符频率,根据频率构建哈夫曼树生成编码。接着,将编码写入压缩文件,并保存头文件信息。在解压缩时,读取头文件恢复哈夫曼树,依据树结构还原文件。详细源代码链接已提供。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

利用哈夫曼树实现文件的压缩与解压缩
压缩:
1、统计出文件中相同字符出现的次数
2、获取哈夫曼编码
次数作为权值构建哈夫曼树
3、重新编码,写回压缩文件
保存头文件:
源文件后缀
编码信息的行数
每个字符的权
保存编码

解压缩:
1、获取原文件后缀
2、获取每个字符出现的次数,即权值
3、利用之前后的的权值,还原哈夫曼树
4、找到对应的叶子节点,将信息保存到解压文件中
在写压缩文件之前,首先需要实现堆和哈夫曼树
源代码戳这里
(https://coding.net/u/g33_N/p/fileCompress/git)

#define _CRT_SECURE_NO_DEPRECATE
#include"HuffManTree.h"
#include<assert.h>
struct FileInfo
{
    FileInfo()
    :_count(0)
    {}
    unsigned char _ch;//当前字符
    size_t _count;//当前字符出现的次数
    std::string _strCode;//当前字符的哈夫曼编码
    //重载+
    FileInfo operator+(const FileInfo& fileInfo)
    {
        FileInfo ret(*this);
        ret._count += fileInfo._count;
        return ret;
    }
    //重载<
    bool operator<(const FileInfo& fileInfo)const
    {
        return _count<fileInfo._count;
    }
    //重载!=
    bool operator != (const FileInfo& fileInfo)const
    {
        return _count != fileInfo._count;
    }
};
class CompressFile
{
public:
    CompressFile()
    {
        for (size_t idx = 0; idx < 256; ++idx)
        {
            _fileInfo[idx]._ch = idx;
            _fileInfo[idx]._count = 0;//每一个字符出现的次数初始化为0
        }
    }
    void FileCount(const std::string& strFileName)
    {
        //统计字符出现的次数
        FILE* fOut = fopen(strFileName.c_str(), "r");//打开一个文件
        assert(fOut);
        unsigned char rBuf[1024];//存取读到的文件内容

        while (1)
        {
            size_t rSize = fread(rBuf, 1, 1024, fOut);//返回从文件中读到的字节数

            if (rSize == 0)
                break;
            for (size_t idx = 0; idx < rSize; ++idx)
            {
                _fileInfo[rBuf[idx]]._count++;//统计每个字符出现的次数
            }
        }
    }
    //获取编码信息
    void GetHuffManCode()
    {

        // 创建HuffManTree
        HuffmanTree<FileInfo> ht(_fileInfo, sizeof(_fileInfo) / sizeof(_fileInfo[0]), FileInfo());
        _GetHuffManCode(ht.GetRoot());//获取哈夫曼编码
综合实验: 1. 问题描述 利用哈夫曼编码进行通信可以大大提高信道利用率,缩短信息传输时间,降低传输成本。这要求在发送端通过一个编码系统对待传输数据预先编码,在接收端将传来的数据进行译码(复原)。对于双工信道(即可以双向传输信息的信道),每端都需要一个完整的编/译码系统。试为这样的信息收发站编写一个哈夫曼码的编/译码系统。 2. 基本要求 一个完整的系统应具有以下功能: (1) I:初始化(Initialization)。从终端读入字符集大小n,以及n个字符和n个权值,建立哈夫曼,并将它存于文件hfmTree中。 (2) E:编码(Encoding)。利用已建好的哈夫曼(如不在内存,则从文件hfmTree中读入),对文件ToBeTran中的正文进行编码,然后将结果存入文件CodeFile中。 (3) D:译码(Decoding)。利用已建好的哈夫曼文件CodeFile中的代码进行译码,结果存入文件Textfile中。 (4) P:印代码文件(Print)。将文件CodeFile以紧凑格式显示在终端上,每行50个代码。同时将此字符形式的编码文件写入文件CodePrin中。 (5) T:印哈夫曼(Tree printing)。将已在内存中的哈夫曼以直观的方式(比如)显示在终端上,同时将此字符形式的哈夫曼写入文件TreePrint 中。 3. 测试数据 用下表给出的字符集和频度的实际统计数据建立哈夫曼,并实现以下报文的编码和译码:“THIS PROGRAME IS MY FAVORITE”。 字符 A B C D E F G H I J K L M 频度 186 64 13 22 32 103 21 15 47 57 1 5 32 20 字符 N O P Q R S T U V W X Y Z 频度 57 63 15 1 48 51 80 23 8 18 1 16 1
评论 7
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值