信息熵与压缩编码基础

本文介绍了信息熵的概念,按照香农的理论解释了熵在事件信息量平均值中的意义。通过具体例题展示了如何计算一串消息的信息熵,并对比分析了采用香农-凡诺编码和霍夫曼编码后的压缩率。同时,文章还讨论了非压缩格式BMP图像的内存占用及文件大小计算。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

什么是信息熵

定义:按照香农的理论,在有限的互斥和联合穷举事件合集中,熵为事件的信息量的平均值,也称事件的平均信息量。
在数学上表示为发
在这里插入图片描述
在这里插入图片描述

例题

一串消息包含A,B,C,D,E共5类符号,其内容是AABBBBAAAACCCCCCCCCEEEEEEDDDDEEEEEEEEEEEEE, 请问其信息熵是多少?如果分别采用香农-凡诺编码,霍夫曼编码,压缩率分别是多少?
在这里插入图片描述
在这里插入图片描述
采用香农-凡诺编码
按照概率大小排序,再分割E,C分为19和23,再从C,A,B,D中分割C,A分为了9,14,再从A,B,D中分割为A,B分为6和8,再将B和D分割。
在这里插入图片描述
编码前:5个符号需要三位,42个字符共126。
编码后:共87位
压缩比:126:87=1.45:1

采用霍夫曼编码
根据符号的次数,E>C>A>B,D,B=D。
先将B,D组成节点共8,再与A组成节点共14,再与C组成节点共23,再与E组成节点。
在这里插入图片描述
编码前:5个符号需要三位,42个字符共126。
编码后:共87位
压缩比:126:87=1.45:1

一幅1024768的24位RGB彩色图像一共在内存中占有多少字节? 如果将其保存为非压缩格式的BMP文件,文件有多少字节?

RGB占3字节的话,文件共1024768*3=2_359_296字节。
BMP文件由文件头、位图信息头、颜色信息和图形数据四部分组成。
对于24-位真彩色图像就不使用彩色板,因为位图中的RGB值就代表了每个象素的颜色。
故文件头+位图信息头+颜色信息为55字节
保存为非压缩格式的BMP文件,文件共有2_359_351字节。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值