https://blog.youkuaiyun.com/lxlmycsdnfree/article/details/78926359 参考自大佬的博客,记录自己的学习心得
一、出现了什么问题?
当存储一个int数组时,假设数组长度是5, array = [1,2,5,7,11]。 此时数组在内存中占用了5*4bytes = 160bits;好像没什么问题。那如果数组长度是10亿呢?
10亿 * 4 / (1024 * 1024 * 1024) = 3.72Gbytes左右。内存应该很对这么大的数组进行处理。此外,如果对数据进行分批处理,势必会消耗I/O和磁盘,不是高效的方案。
二、BitMap是什么?
一个字节-byte是占8个位-bit,在计算机中,每一位的值只能是0或者1。0/1也可以表达有或者没有,如果用bit的位置代表数组值存在还是不存在,也就是说0代表数组不存在这个位置的值,1代表该数组值存在,具体如下图:
转载自https://blog.youkuaiyun.com/lxlmycsdnfree/article/details/78926359
使用BitMap的方法存储,之前一个int占用4个字节,现在只占用1bit。那么10亿个整数的存储所用内存大小为: