专业视角下的核心:权衡与上下文
所有压缩算法的设计和选择都围绕着一个核心的权衡:压缩比 vs. 速度/资源消耗。没有任何一个算法在所有场景下都是最优的。
- 压缩比:压缩后文件大小的减少程度。
(1 - 压缩后大小 / 原始大小) * 100% - 速度:包括压缩速度和解压速度。通常,解压速度比压缩速度更重要(例如在视频流媒体中,需要实时解压)。
- 内存/CPU消耗:算法运行所需的内存和计算资源。
不同的应用场景决定了不同的权衡策略:
- 在线传输(如网页加载):优先考虑解压速度,压缩比次之(GZIP)。
- 归档存储(如备份文件):优先考虑压缩比,压缩速度可以慢一些(LZMA、ZPAQ)。
- 实时多媒体(如视频通话):必须优先保证编码和解压速度(低延迟),允许一定的质量损失(有损)。
一、 无损压缩的深入实操分析
1. LZ77 算法及其变种 (字典编码的基石)
这是绝大多数通用无损压缩格式的核心(ZIP, GZIP, PNG, HTTP压缩)。
- 核心机制:滑动窗口 + 前向缓冲区
- 滑动窗口:代表刚刚处理过的数据(字典)。
- 前向缓冲区:代表即将要压缩的数据。
- 操作:算法总是在前向缓冲区中寻找与滑动窗口中匹配的最长字符串。
- 输出:找到一个匹配后,输出一个三元组
(offset, length, next_char):offset: 匹配字符串在滑动窗口中的起始位置(回溯距离)。length: 匹配的长度。next_

最低0.47元/天 解锁文章
790

被折叠的 条评论
为什么被折叠?



