考虑下面几个应用场景:
- 统计每天的日活(访问量、用户数等)
- 统计某个部门的联系客户量
- 对大量数据进行排序
针对第一种应用场景,通常的做法就是采用明细表来记录每一个访问量,然后统计每天的用户数(用一个用户,多次访问,只算一个)。
这里有个问题,就是假设用户量比较大,假设一天有1000万的请求量,一个月就有3亿的数据量,对数据库的压力比较大。
这是我们就可以考虑采用BigMap来实现,它之间用位置代替数字,用0和1来表示这个数字是否存在,可以加大的压缩存储空间。比如说,1亿个用户一天的数据量也就 1 0000 0000bit = 11.92m,也就是说用户一天的登录信息也就产生11.92m的数据量。一个月也就357.63m的数据量。
Java的实现就是BigSet,下面是一段实现代码:
BitSet bm = new BitSet();
System.out.println(bm.isEmpty()+"--"+bm.size());
bm.set(0);
System.out.println(bm.isEmpty()+"--"+bm.size());
bm.set(1);
System.out.println(bm.isEmpty()+"--"+bm.size());
System.out.println(bm.get(65));
System.out.println(bm.isEmp

本文探讨了BitMap算法在处理大规模数据场景中的应用,如统计日活和部门联系客户量,以减少数据库压力。Java中的BigSet是BitMap的一种实现,它通过位操作高效存储数据。然而,当数据过于稀疏时,可能会导致遍历效率降低。此外,当数据超过int范围,可以使用多个BitSet存放。BigSet还能用于实时统计和数据排序,提供比传统方法更高的性能。
订阅专栏 解锁全文
6万+

被折叠的 条评论
为什么被折叠?



