18、布隆过滤器:减少内容跟踪的内存占用

布隆过滤器:减少内容跟踪的内存占用

1. 位的读写

在实现布隆过滤器时,我们首先需要一些辅助方法,这些方法是构建 API 实现的基础。具体来说,我们需要:
- 能够在过滤器缓冲区的任意位置读写位。
- 建立输入键与缓冲区中位索引的映射。
- 一组确定性生成的哈希函数,用于将键转换为索引列表。

为了节省内存,我们需要将位打包到编程语言中可用的最小整数类型中。这意味着在读写位时,我们需要将待访问位的索引映射为两个整数。在现代编程语言中,通常可以使用固定大小的基本类型数值数组和向量代数来加速这些操作。当我们要访问过滤器中的第 i 位时,需要从索引 i 中提取两个坐标:存储第 i 位的数组元素,以及该位相对于该元素的偏移量。

以下是计算这两个坐标的函数:

def findBitCoordinates(index):
    byteIndex = index // BITS_PER_INT
    bitOffset = index % BITS_PER_INT
    return (byteIndex, bitOffset)

有了这两个索引,我们就可以轻松地读写任意位,这只涉及位运算。以下是读取位的函数:

def readBit(bitsArray, index):
    (element, bit) = findBitCoordinates(index)
    return (bitsArray[element] & (1 << 
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值