利用哈夫曼树实现文件压缩

最新推荐文章于 2023-12-11 21:06:52 发布

原创

最新推荐文章于 2023-12-11 21:06:52 发布 · 6.5k 阅读

67 ·

CC 4.0 BY-SA版权

文章标签：

#文件压缩 #数据结构 #源代码 #压缩 #结构

实现原理：

1.按照字符分析要压缩的文件得出结果（有哪些字符，每个字符出现的次数）。

2.根据字符出现的次数构建哈夫曼树（得出字符的哈夫曼编码）。

3.根据字符的哈夫曼编码进行转换、压缩，然后创建压缩文件。

4.读取压缩文件，读出哈夫曼编码和字符的对照表。解压缩。

数据结构的设计：

1.保存字符次数和字符的数据结构

struct _symbol{

char character;//字符

unsigned int number;//字符出现的次数

char huffecode[20];//编码

}

2.用一个结构体保存所有字符的信息

struct _filestate{

char symbol_count;//字符种类

struct _symbol symbol_array[128];//字符信息

};

3.哈夫曼树节点

struct node{

struct _symbol symbol;

struct node *left;

struct node *right;

};

4.哈夫曼编码

struct code{

char character;

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Melody20210917

关注关注

14
点赞
踩
67

收藏

觉得还不错? 一键收藏
4
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

哈夫曼压缩与解压缩（c语言版）

qq_42034205的博客

09-29

1万+

目录 哈夫曼压缩与解压缩（c语言版）一：引言二：主要原理三：主要技术点四：实现过程 1.压缩： 2.解压缩：五：详细分析，及代码实现 哈夫曼压缩与解压缩（c语言版）一：引言学过数据结构的同学，应该都听过哈夫曼树，和哈夫曼压缩算法，今天小编向大家讲解哈夫曼压缩与压缩的过程以及代码也算是记录一下自己所学所做的东西。 哈夫曼压缩，其实效率不是很高，一般情况下压缩率1...

第1关：基于哈夫曼树的数据压缩算法-头歌-北京林大

DongLiu_Wen的博客

11-19

5782

输入一串字符串，根据给定的字符串中字符出现的频率建立相应哈夫曼树，构造哈夫曼编码表，在此基础上可以对待压缩文件进行压缩（即编码），同时可以对压缩后的二进制编码文件进行解压（即译码）。

4 条评论您还未登录，请先登录后发表或查看评论

哈夫曼树实现文件压缩和解压（源程序+实验报告）

12-02

综合实验： 1. 问题描述利用哈夫曼编码进行通信可以大大提高信道利用率，缩短信息传输时间，降低传输成本。这要求在发送端通过一个编码系统对待传输数据预先编码，在接收端将传来的数据进行译码（复原）。对于双工信道（即可以双向传输信息的信道），每端都需要一个完整的编/译码系统。试为这样的信息收发站编写一个哈夫曼码的编/译码系统。 2. 基本要求一个完整的系统应具有以下功能： (1) I：初始化（Initialization）。从终端读入字符集大小n，以及n个字符和n个权值，建立哈夫曼树，并将它存于文件hfmTree中。 (2) E：编码（Encoding）。利用已建好的哈夫曼树（如不在内存，则从文件hfmTree中读入），对文件ToBeTran中的正文进行编码，然后将结果存入文件CodeFile中。 (3) D：译码（Decoding）。利用已建好的哈夫曼树将文件CodeFile中的代码进行译码，结果存入文件Textfile中。 (4) P：印代码文件（Print）。将文件CodeFile以紧凑格式显示在终端上，每行50个代码。同时将此字符形式的编码文件写入文件CodePrin中。 (5) T：印哈夫曼树（Tree printing）。将已在内存中的哈夫曼树以直观的方式（比如树）显示在终端上，同时将此字符形式的哈夫曼树写入文件TreePrint 中。 3. 测试数据用下表给出的字符集和频度的实际统计数据建立哈夫曼树，并实现以下报文的编码和译码：“THIS PROGRAME IS MY FAVORITE”。字符 A B C D E F G H I J K L M 频度 186 64 13 22 32 103 21 15 47 57 1 5 32 20 字符 N O P Q R S T U V W X Y Z 频度 57 63 15 1 48 51 80 23 8 18 1 16 1

哈夫曼编码，HuffMan Tree，实现文件压缩_java压缩软件小项目_01

cyming_的博客

08-24

890

1、能够选择任一文本文件，压缩，保存在本地。保存的压缩文件可自己命名。2、能够解压压缩文件3、压缩算法使用哈夫曼编码。

关于Huffman 压缩

starfish的专栏

03-22

2718

关于Huffman 压缩0.原理 Huffman编码是一种可变长编码方式，是由美国数学家David Huffman创立的，是二叉树的一种特殊转化形式。编码的原理是：将使用次数多的代码转换成长度较短的代码，而使用次数少的可以使用较长的编码，并且保持编码的唯一可解性。Huffman算法的最根本的原则是：累计的(字符的统计数字*字符的编码长度)为最小，也就是权值(字符的统计数字*字符的编码长度)的

数据结构课设之C++利用哈夫曼树实现文件压缩程序的设计

最新发布

04-17

哈夫曼编码是一种广泛应用于数据压缩的编码方式，它基于字符出现频率的不同，通过构建一棵特殊的二叉树——哈夫曼树来实现最优前缀编码。哈夫曼树的构建原理是利用了信息熵的概念，通过降低常用字符的编码长度和增加...

基于哈夫曼树的文件压缩和解压（QT可视化界面）

10-04

《基于哈夫曼树的文件压缩与解压技术在QT可视化界面中的实现》 哈夫曼编码是一种数据压缩算法，其核心是构建哈夫曼树，通过对数据出现频率的统计，构建出一棵特殊的二叉树——哈夫曼树，使得出现频率高的字符具有较...

利用哈夫曼树实现文件压缩和解压缩

hello_woo的博客

08-20

8375

完成文件压缩与解压缩花了近一个星期的时间，期间，花了很遇到不少问题，花了很长时间去调试，最后完成了文本文件的压缩。通过调用库中的优先级队列实现哈夫曼树，基于哈夫曼树最终实现文件压缩。 ## 实现哈夫曼树（利用优先级队列） ## #define _CRT_SECURE_NO_WARNINGS 1 #pragma once #include&amp;lt;iostream&amp;gt; #include...

哈夫曼树实现文件压缩

精致的灰的博客

09-11

3766

使用哈夫曼树实现文件的压缩和解压缩

基于哈夫曼树的数据压缩算法讲解

weixin_39302449的博客

05-11

2162

该算法通过构建一棵二叉树来实现对字符集的压缩，使得出现频率高的字符编码短，出现频率低的字符编码长，从而实现对数据的有效压缩。需要注意的是，在使用哈夫曼树进行数据压缩时，编码表必须与压缩的数据一起存储，否则解压缩时无法还原原始数据。同时，哈夫曼树的构建需要消耗一定的时间和空间，因此在实际应用中需要根据数据的特点进行权衡和选择。对于每个叶子节点，用从根节点到该叶子节点的路径上的 0 和 1 来表示该字符的编码，出现频率高的字符编码短，出现频率低的字符编码长。将字符集中的每个字符根据其对应的编码进行压缩。

哈夫曼树压缩算法实现

04-23

这是我做的一个基于哈夫曼树思想的压缩算法程序源码，希望大家指正

利用哈夫曼编码压缩文件

Jonathan97的博客

09-05

6830

大作业报告 1. 简介/介绍/引言本大作业主要考核如何以C实现集成电路测试向量文件的无损压缩。在通常的文件存储中，无论是二进制格式的文件还是文本文件，几乎都是等宽的编码。比如ASCII码格式的文本文件，每个字符由一个ASCII码表示，宽度为8bit。然而，从磁盘空间利用率的角度看，这并不是一种效率最高的存储方案。为了理解定长编码与变长编码的区别，假设某个文件纯粹由abcdef共

哈夫曼树实现数据压缩

weixin_48065337的博客

12-11

1753

java实现哈夫曼树，利用哈夫曼编码进行数据压缩，解决压缩数据恢复不一致现象

基于哈夫曼(haffuman)算法的文件压缩的实现（C语言）(转)

weixin_33922672的博客

07-30

642

本文首先简要阐述哈夫曼算法的基本思想，然后介绍了使用哈夫曼算法进行文件压缩和解压缩的处理步骤，最后给出了C语言实现的文件压缩和解压缩的源代码。 哈夫曼算法的主要思想是： ①首先遍历要处理的字符串，得到每个字符的出现的次数； ②将每个字符（以其出现次数为权值）分别...

【数据结构】通过哈夫曼树实现对文本的压缩与解压

无极阁

01-19

4349

一、前言之前做的一个数据结构作业，通过哈夫曼树实现对文本的压缩与解压，参考了很多网上的方法，因为时间有限，注释并没有写，但是代码缩进还是比较清晰。另外，哈夫曼树我单独写了个头文件，是在之前写二叉树类的基础上改的，所以其实里面有很多用不到的代码，比如多种遍历方式，包括递归和非递归的实现，大家忽略即可。代码用C++编写，因为用到模版，所以头文件和cpp实现没有分开，强行分开坑比较多，这里不多解释...

利用哈夫曼编码实现压缩文件

weixin_43812622的博客

11-21

1754

实现功能 1.压缩文本文件 xzip 源文件名字压缩后文件名字 2.解压文本文件 xuzip 压缩文件名字解压后文件名字 3.压缩比大约18%左右(与文件内容有关系) 4.做成了类似Linux命令的样子放在了/bin目录下 ...

哈夫曼树压缩文件

qq_63982145的博客

05-29

391

1.问题描述准备一个文件，对该文件各种字符进行Huffman编码，将该文件翻译成Huffman文件。 2.基本要求 (1)设计哈夫曼树的结点存储结构 (2)设计编码和破译方法 (3)输入：源文件 (4)输出：Huffman编码文件 3.程序实现： (1)代码： #include<iostream> #include <fstream> #include<map> #include<queue> #include <string&g

哈夫曼树算法压缩文件

03-12

2638

今天上午上了哈夫曼算法压缩的课，我学习到了用哈夫曼算法压缩文件，可以将一个文件压缩百分之六十左右的大小。具体原理是：文件是由一个个字节组成，而字节有自己的ASCII码值，然后用一个整形数组把文件的ASCII码值记下来，出现了一个就在其对应的ASCII值得int数组下标加一。然后用哈夫曼算法处理这个整形数组，得到哈夫曼编码值，然后读入文件的哈夫曼编码值，最后写入压缩文件。 哈夫曼压缩需要三个容

利用哈夫曼树实现文件压缩C

01-02

### 使用哈夫曼树在C语言中实现文件压缩 哈夫曼编码是一种广泛应用于数据压缩的技术，能够有效地减少存储空间并提高传输效率。通过构建哈夫曼树来生成最优前缀码表，进而对输入的数据流进行编码。为了理解如何利用哈夫曼树在C语言中实现文件压缩，可以考虑以下几个方面： #### 构建频率统计表首先读取待压缩文件中的字符，并记录每个字符出现的次数。这一步骤对于后续创建哈夫曼树至关重要[^1]。 ```c #include <stdio.h> #define MAX_CHAR 256 void countFrequency(FILE *file, int freq[]) { char ch; while ((ch = fgetc(file)) != EOF) { ++freq[ch]; } } ``` #### 创建最小堆用于构造哈夫曼树基于上述得到的频次信息，在内存中建立一个小根堆（Min Heap），以便高效地找到两个具有最低概率节点组合成新的内部结点直至形成完整的二叉树结构。 ```c typedef struct MinHeapNode { unsigned char data; /* 存储的是ASCII码 */ unsigned int frequency; /* 出现次数 */ struct MinHeapNode *left, *right; } MinHeapNode; // ...省略部分辅助函数... struct MinHeap* createAndBuildMinHeap(int size); MinHeapNode* buildHuffmanTree(const int freq[], const int size); ``` #### 编写编码映射关系遍历已建成的哈夫曼树自顶向下分配'0'/'1'路径给各个叶子节点代表其对应的唯一编码串；最终获得一张由原始字节到变长位序列之间的转换对照表。 ```c void printCodes(struct MinHeapNode* root, int arr[], int top); /* Helper function to store huffman codes of characters */ void HuffmanCodes(MinHeapNode* root, int arr[], int top, char result[][MAX_TREE_HT], int* topArr) { if (root->left) { arr[top] = 0; HuffmanCodes(root->left, arr, top + 1, result, topArr); } if (root->right) { arr[top] = 1; HuffmanCodes(root->right, arr, top + 1, result, topArr); } if (!root->left && !root->right) { // 叶子节点 (*topArr)++; strcpy(result[*topArr], &arr[0]); } } char* getEncodedData(char data[], int length, char encodedResult[][MAX_TREE_HT]) { static char encodedString[MAX_SIZE]; for (int i = 0; i <= length; i++) strcat(encodedString, encodedResult[data[i]]); return encodedString; } ``` #### 实际应用——文件压缩过程最后按照之前准备好的编码方案逐个替换原文件里的每一个byte为更短形式保存至目标位置完成整个压缩流程。 ```c FILE* compressFile(const char* inputFilePath, const char* outputFilePath){ FILE *inputFile = fopen(inputFilePath,"rb"); FILE *outputFile = fopen(outputFilePath,"wb"); // 统计频率... // 建立哈夫曼树... // 获取编码表... fwrite(compressedBuffer,sizeof(unsigned char),compressedSize,outputFile); fclose(inputFile); fclose(outputFile); return outputFile; } ```