利用huffman编码对文本文件进行压缩与解压（java实现）

最新推荐文章于 2025-03-15 14:00:00 发布

王胖胖要加油鸭

最新推荐文章于 2025-03-15 14:00:00 发布

阅读量3.9k

点赞数 8

分类专栏：算法文章标签： huffman编码压缩文件

本文链接：https://blog.youkuaiyun.com/qq_35443700/article/details/102996371

版权

本文介绍如何使用Huffman编码对文本文件进行压缩和解压缩。通过统计字符频度构建哈夫曼树，生成编码并以二进制流压缩文件。在字符分布均匀时，压缩效果可能不佳。程序会显示字符频率、编码、原始及压缩/解压缩文件内容。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

利用huffman编码对文本文件进行压缩与解压

输入：一个文本文件
输出：压缩后的文件

算法过程：
（1）统计文本文件中每个字符的使用频度
（2）构造huffman编码
（3）以二进制流形式压缩文件

采用哈夫曼编码进行文件的压缩和解压，主要原理是通过huffman编码来表示字符，出现次数多的编码短，出现次数少的编码长，这样整体而言，所需的总的比特位是最少的。但是当大部分字符出现的频率都差不多时，huffman压缩的压缩率就会很低。先统计出文件中各个字符出现的次数；构建哈夫曼树,生成每个字符对应的编码，然后将编码写入压缩文件中；解压缩是将压缩后的文件翻译过来，根据哈夫曼编码找到对应的字符。

package compress_file;

import java.io.BufferedReader;
import java.io.FileReader;
import java.util.*;

class HaffmanTree {
   //哈夫曼树类
	public static final int MAXVALUE = 1000;// 最大权值
	public int nodeNum; // 叶子结点个数

	public HaffmanTree(int n) {
   
		this.nodeNum = n;
	}

	public void haffman(char[] names, int[] weight, HaffNode[] nodes) {
   //构造哈夫曼树,weight 权值,nodes 叶子节点
		int n = this.nodeNum;
		int m1, m2, x1, x2;// m1,m2,表示最小的两个权值，x1、x2表示最小两个权值对应的编号,m1表示最小，m2表示次小
		for (int i = 0; i < 2 * n - 1; i++) {
   // 初始化所有的结点，对应有n个叶子结点的哈夫曼树，有2n-1个结点
			HaffNode temp = new HaffNode();
			// 初始化n个叶子结点，就是输入的节点。0、1、2、3是叶子节点也是输入的节点
			if (i < n) {
   
				temp.name = names[i];
				temp.weight = weight[i];
			} else {
   
				temp.name = ' ';
				temp.weight = 0;
			}
			temp.parent = 0;
			temp.flag = 0;
			temp.leftChild = -1;
			temp.rightChild = -1;
			nodes[i] = temp;
		}
		
		for (int i = 0; i < n - 1; i++) {
   // 初始化n-1个非叶子结点，n-1表示要循环n-1次求的n-1个数
			m1 = m2 = MAXVALUE;
			x1 = x2 = 0;
			// 求得这n-1个数时，每次都是从0到n+i-1,并且flag=0的，flag=1表示已经加入到二叉树。
			// 以下是找出权值最小的2个
			for (int j = 0; j < n + i; j++) {
   
				if (nodes[j].weight < m1 && nodes[j].flag == 0) {
   
					// m1,x1初始值为第一个元素，后面如果比m1要小，则m1指向更小的，原来m1指向的现在由m2指向，
					// 如果后面比m1大比m2小，则m2指向这个比m1大比m2小的，
					// 也就是说m1指向最小的，m2指向第2小的。
					m2 = m1;
					x2 = x1;
					m1 = nodes[j].weight;
					x1 = j;
				} else if (nodes[j].weight < m2 && nodes[j].flag == 0) {
   
					m2 = nodes[j].weight;
					x2 = j;
				}
			}
			// 将权值最小的2个组合成一个二叉树
			nodes[x1].parent = n + i;
			nodes[x2].parent = n + i;
			nodes[x1].flag = 1;
			nodes[x2].flag = 1;
			nodes[n + i].weight = nodes

最低0.47元/天解锁文章