
作用:减少文件占用空间(文件压缩)
大致原理:
- 统计文件中每一个字符的出现次数
- 画一棵树,每个字母在不同的叶子上,每片叶子有不同的编号
- 使用这些编号代表每个字母,翻译一遍原文,获得更小的文件体积
一些原理中的问题:
为什么每片叶子有不同的编号?
答:二叉树,左边代表0,右边代表1,比如上图各字符对应的编码为:A->11,B->10,C->00,D->011,E->010。每个节点都有不同的编号。在获得编号之后,直接将原字符使用编号替代,由于编号只占2-3个字节,而原字符占7-8个字节,因此得以压缩。
哈夫曼算法的作用?
答:按贪婪算法构造字符的编码树,使翻译后文件的体积最小。
本文探讨了文件压缩的基本原理,通过构建字符出现频率的哈夫曼树,实现对文件的高效压缩。哈夫曼算法利用贪婪策略构造编码,使得翻译后的文件体积最小。这一过程涉及到字符统计、二叉树构建以及字符替换,有效减少了文件占用空间。
2万+

被折叠的 条评论
为什么被折叠?



