针对特定应用的字典压缩算法

最新推荐文章于 2025-09-11 06:08:56 发布

原创最新推荐文章于 2025-09-11 06:08:56 发布 · 290 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

算法专栏收录该内容

11 篇文章

订阅专栏

要使用字典压缩算法，必须找到一个好的压缩字典。这个字典中的词在原始数据中出现的次数要足够多。出现的愈多的词，压缩比应该越大。

使用字典压缩实现起来比较简单，效率也比较高。但是一个问题是，当压缩和解压缩不是在同一个地方的时候，很难保证同时更新。当不能保证同时更新的时候就对压缩字典的稳定性就有更高的要求。也就是说，不管针对什么原始数据，压缩比的波动幅度不要太大。

使用了分级的压缩字典。统计得到了三个压缩字典，字典的词数目逐渐增加，能压缩的字节数却是逐渐减少。类似于3级Cache的原理，在第一个字典中出现的词的概率大，但是字典的词比较少；在第3个字典中出现的词的概率最小，但是字典中词的个数最大。

我使用的字典压缩算法，是对一个特定的数据做的，其数据都是字母和数字，所以压缩效果还比较好。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。