布隆过滤器

最新推荐文章于 2025-12-03 21:44:25 发布

原创最新推荐文章于 2025-12-03 21:44:25 发布 · 377 阅读

CC 4.0 BY-SA版权

文章标签：

35 篇文章

订阅专栏

在这里插入图片描述

布隆过滤器（Bloom Filter）是一种空间效率极高的概率型数据结构，主要用于测试一个元素是否是某集合的成员。它的特点是可能会误判（即认为某元素在集合中，但实际上并不在），但不会漏判（即不可能认为一个集合中的元素不在集合中）。

布隆过滤器通过使用多个哈希函数和一个位数组来存储信息。其主要步骤如下：

初始化：创建一个位数组，所有位初始化为0。
添加元素：对于每个要加入集合的元素，布隆过滤器通过多个哈希函数生成多个哈希值，然后在位数组的对应位置将这些值设为1。
查询元素：要检查某个元素是否在集合中，布隆过滤器通过相同的哈希函数计算该元素的哈希值，并检查位数组中对应位置的值。如果所有位置都是1，可能是集合中有该元素；如果有任何位置是0，则肯定不在集合中。

空间效率高：相比传统的集合或哈希表，布隆过滤器占用的内存要少得多。
查询速度快：布隆过滤器查询操作是常数时间复杂度（O(k)，k为哈希函数个数）。
误判率：布隆过滤器会出现误判，指示一个元素可能在集合中。误判率与位数组的大小、哈希函数的数量、添加的元素数量等因素有关。
不能删除元素：标准的布隆过滤器不能删除元素，删除元素可能会影响其他已经存储的元素的正确性。虽然有变种如“计数布隆过滤器”能够实现删除，但通常需要更多的空间。