哈夫曼树实现文件的压缩与解压

本文介绍了如何使用哈夫曼树进行文件的压缩与解压。首先,详细阐述了哈夫曼树的构造过程,通过合并权重最小的树来生成最终的哈夫曼树。接着,讲解了利用哈夫曼树生成编码的方法,通过左子树路径为0,右子树路径为1来确定每个数据的编码。最后,说明了实际的文件压缩原理,即用哈夫曼编码替换原始编码以减少位数,从而达到压缩目的。并提到了源码的存在,但存在一些无用变量,需要指定文件路径。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一.哈夫曼树的构造方法

1.首先要拿到一组数据及其权重,其中每个数据都作为一颗哈夫曼树(也可以被视为一个结点)。

2.在这些树中找到权重最小的两棵树,将其合并为一棵树。合并方法:将这两棵树的权重相加,权重和为一个新的结点,并且为原来两棵树的父节点(即新树的根节点)。然后在剩余的这些树中(第一次合并的两棵树不再存在于该数据群,取而代之的是他们的父节点)继续找到权重最小的两棵树进行合并,以此方法迭代直至生成一棵树,即最后的哈夫曼树。

二.生成哈夫曼编码

在哈夫曼树中,左子树的路径定义为0,右子树的路径定义为1。由此可以得到每一个数据的哈夫曼码。

三.实现文件压缩与解压

这里用哈夫曼树实现文件压缩实质是改变了文件的编码方式。比如原文件用100位编码表示,将其中每一个数据对应的编码用哈夫曼码替代后,该文件编码就只有70位,这就实现了文件压缩。

四.源码

注:当时写完就没有更改,里面存在一些无用的变量。文件路径也需自己指定

huffman_tree.h

#include <iostream>
#include <queue> 
#include <string>
#ifndef _HUFFMAN_TREE_H_
#define _HUFFMAN_TREE_H_
using namespace std;

	struct store{
		unsigned char data;
		int weight;
		string code;
	};
	
	struct htnode{	//非叶子结点只记录权重,叶子结点需记录权重和数据 
		unsigned char data;
		int weight;
		string code;
		htnode *lchild,*rchild;
	};
		
	struct cmp{	//重写仿函数 
		bool operator()(htnode* a,htnode* b){
		return a -> weight > b -> weight;	//权值小的在队列头 
		}
	};

class huffman_tree{
	private:
		htnode *root;
	public:
		huffman_tree();
		~huffman_tree();
		void creat(struct store*,int);
		void get_hcode(store*);
		void hcode(htnode*,string,store* s);
		void drop(htnode*);
		void visit(htnode*);
		htnode* get_root();
};
#endif

huffman_tree.cpp


                
综合实验: 1. 问题描述 利用哈夫曼编码进行通信可以大大提高信道利用率,缩短信息传输时间,降低传输成本。这要求在发送端通过一个编码系统对待传输数据预先编码,在接收端将传来的数据进行译码(复原)。对于双工信道(即可以双向传输信息的信道),每端都需要一个完整的编/译码系统。试为这样的信息收发站编写一个哈夫曼码的编/译码系统。 2. 基本要求 一个完整的系统应具有以下功能: (1) I:初始化(Initialization)。从终端读入字符集大小n,以及n个字符和n个权值,建立哈夫曼,并将它存于文件hfmTree中。 (2) E:编码(Encoding)。利用已建好的哈夫曼(如不在内存,则从文件hfmTree中读入),对文件ToBeTran中的正文进行编码,然后将结果存入文件CodeFile中。 (3) D:译码(Decoding)。利用已建好的哈夫曼文件CodeFile中的代码进行译码,结果存入文件Textfile中。 (4) P:印代码文件(Print)。将文件CodeFile以紧凑格式显示在终端上,每行50个代码。同时将此字符形式的编码文件写入文件CodePrin中。 (5) T:印哈夫曼(Tree printing)。将已在内存中的哈夫曼以直观的方式(比如)显示在终端上,同时将此字符形式的哈夫曼写入文件TreePrint 中。 3. 测试数据 用下表给出的字符集和频度的实际统计数据建立哈夫曼,并实现以下报文的编码和译码:“THIS PROGRAME IS MY FAVORITE”。 字符 A B C D E F G H I J K L M 频度 186 64 13 22 32 103 21 15 47 57 1 5 32 20 字符 N O P Q R S T U V W X Y Z 频度 57 63 15 1 48 51 80 23 8 18 1 16 1
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值