《画解数据结构》(2 - 6)- 霍夫曼树

本文介绍了霍夫曼编码的原理,包括压缩率的概念、变长编码与前缀编码的特点,以及霍夫曼树的构造过程。通过一个字符串“HelloWorld”的例子,展示了霍夫曼编码如何将字符映射为比特串,以及压缩和解压缩的过程。同时,讨论了在不同字符集合下压缩率的变化,并探讨了编码和解码的具体实现细节。

一、概述

1、算法简述

  • 众所周知,计算机中数据的存储和传输的最小单位是字节(byte),一个ASCII 码占用 1 个字节, 每个字节为 8 个比特位(Bit);例如,字符 ‘e’ 的二进制表示为 01100101;
  • 进程间通信传输字节流的过程中,为了节省带宽,往往会对传输的数据进行压缩。
  • 压缩算法有很多,今天介绍一种比较好理解的贪心算法 - 霍夫曼编码;
  • 霍夫曼编码的本质就是对每个出现过的 ASCII 字符,通过一个压缩字典,映射成另一个字符,映射后的字符是二进制比特串:001、0101、00 等等;
  • 解压缩就是这个过程的逆过程;

2、引例

源字节流
  • 首先,一个字符串 “HelloWorld”,在没有进行压缩的情况下采用 ASCII 编码,占用字节总数为 10,即 10 * 8 = 80 个比特位。
压缩字典
  • 然后,通过霍夫曼算法生成压缩字典如下(具体生成过程是霍夫曼树的构造过程,下文会详细讲述):
字符 压缩前编码(ASCII) 压缩后编码
d 01100100<
评论 6
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

英雄哪里出来

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值