数字通信中的编码技术:从图像到视频及错误控制
1. 图像编码基础
数字图像由不同颜色的像素组成,像素可能的颜色数量决定了表示一个像素所需的比特数。例如,若存在 256 种可能的颜色,则需要 8 比特(2^8 = 256)来表示一个像素。对于一个尺寸为 40×40 像素的图像,所需的总比特数为 40 * 40 * 8 = 12800 比特。这种编码技术常用于未压缩的位图(文件扩展名为 .bmp)。
像素编码效率不高,因为它没有考虑相邻像素颜色之间的相关性,也没有考虑图像的感知内容。例如,人类视觉系统对快速的像素颜色过渡不敏感,因此可以丢弃一些不重要的感知信息,而对视觉影响很小。基于这一原理,开发了许多图像编码技术,以实现无损和有损压缩,从而显著减少表示图像所需的比特数。
1.1 无损图像编码
如果考虑相邻像素之间的相关性,就可以实现无损图像编码。信息理论表明,图像的总信息内容可以通过单个像素呈现特定颜色的概率,在所有像素上求和来计算。然后,熵编码方法可以产生高效的编码消息。
可以通过计算相邻像素之间的差异来对图像进行去相关处理。从左上角的像素开始,记录颜色并分配特定的代码。下一个像素颜色略有不同,测量差异并分配代码。可以在水平和垂直轴上移动,测量像素颜色的差异,为差异分配代码,并将它们编译成一个表示图像信息的文件。
如果使用熵编码技术(如霍夫曼编码)对像素间的差异值进行编码,则可以进一步减小编码后的图像大小。这就是便携式网络图形(.png 文件格式)无损图像压缩方法的原理。PNG 压缩适用于像素间变化较小或为零的图像,如文本或图形图像,例如计算机屏幕截图。
超级会员免费看
订阅专栏 解锁全文
14万+

被折叠的 条评论
为什么被折叠?



