1.说明:最近在看《大规模WEB服务开发技术》这本书中,针对GB级,乃至TB级大规模数据,作者开发了可变字节码的压缩数据的算法,以达到压缩数据,减少磁盘IO
,呵呵,扯远了,不过还是极力推荐这本书。
2.相信大家在读到这篇博客的时候,对可变字节码的规律已经了解了,即:任意一个字节的最高位(下标7)均只作为标志位,而且根据字节所在位置需要乘以128的相应幂次;
本文介绍了一种用于大规模数据压缩的可变字节码算法,该算法通过利用字节的最高位作为标志位来实现高效的数据压缩,进而减少磁盘I/O操作,适用于GB级乃至TB级的大规模数据处理场景。
1.说明:最近在看《大规模WEB服务开发技术》这本书中,针对GB级,乃至TB级大规模数据,作者开发了可变字节码的压缩数据的算法,以达到压缩数据,减少磁盘IO
,呵呵,扯远了,不过还是极力推荐这本书。
2.相信大家在读到这篇博客的时候,对可变字节码的规律已经了解了,即:任意一个字节的最高位(下标7)均只作为标志位,而且根据字节所在位置需要乘以128的相应幂次;

被折叠的 条评论
为什么被折叠?