经典算法系列之(一) - BitMap

同名公众号 - 人生代码

于 2019-04-03 08:41:26 发布

阅读量456

点赞数

CC 4.0 BY-SA版权

分类专栏：经典算法系列之(一) - BitMap 安卓开发文章标签：经典算法系列之(一) - BitMap

本文链接：https://blog.youkuaiyun.com/qq_36772866/article/details/88973000

博客介绍了使用Bitmap算法来高效存储和查找大量数据，通过将10亿个整数映射到位数组中，极大地节省了内存空间。文章讨论了如何快速定位数据的索引和位置，并提供了add、clear和contain等操作的代码实现，实现了O(Max/n)的时间复杂度，适合处理大数据场景。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

     BitMap从字面的意思，很多人认为是位图，其实准确的来说，翻译成基于位的映射，怎么理解呢？

举一个例子，有一个无序有界int数组{1,2,5,7},初步估计占用内存44=16字节，这倒是没什么奇怪的，但是假如有10亿个这样的数呢，10亿4/(102410241024)=3.72G左右。如果这样的一个大的数据做查找和排序，那估计内存也崩溃了，有人说，这些数据可以不用一次性加载，那就是要存盘了，存盘必然消耗IO。我们提倡的是高性能，这个方案直接不考虑。

  如果用BitMap思想来解决的话，就好很多，那么BitMap是怎么解决的啊，如下：

一个byte是占8个bit，如果每一个bit的值就是有或者没有，也就是二进制的0或者1，如果用bit的位置代表数组值有还是没有，那么0代表该数值没有出现过，1代表该数组值出现过。不也能描述数据了吗？具体如下图：
在这里插入图片描述
是不是很神奇，那么现在假如10亿的数据所需的空间就是3.72G/32了吧，一个占用32bit的数据现在只占用了1bit，节省了不少的空间，排序就更不用说了，一切显得那么顺利。这样的数据之间没有关联性，要是读取的，你可以用多线程的方式去读取。时间复杂度方面也是O(Max/n)，其中Max为byte[]数组的大小，n为线程大小。

 如果BitMap仅仅是这个特点，我觉得还不是它的优雅的地方，接下来继续欣赏它的魅力所在。下面的计算思想其实就是针对bit的

了解本专栏

超级会员免费看