场景题目 大数据 如何判断一个元素在亿级数据中是否存在? 内存有限,数据量巨大时不能用如HashMap这样的容器,否则OOMBloomFilter,不存在就肯定不存在;存在时有一定误报率,可加大BloomFilter数组长度和Hash函数个数/Hash计算次数,但需要权衡CPU、内存、时间开销。 Guava有成熟的BloomFilter实现。