起源时间
2002年提出来的老算法了,它可以应用在数据库的哈希表中,查找(lookup)非常快,而且可以向量化查找
布谷鸟
布谷鸟不筑巢而是将自己的蛋下在其他鸟的巢中,新孵化的布谷鸟会将巢中的其他蛋推出巢外,以确保自己独享食物。
布谷鸟哈希表的工作原理与此类似,当发生哈希冲突时,它会将已存在的元素“踢出”并寻找新的位置,而不是像传统的哈希表那样使用链表或开放寻址法来解决冲突。
两个关键点:
- 布谷鸟从不筑巢,把蛋生在别的鸟巢穴里;
- 新出生的布谷鸟本能将其它蛋推出,确保自己独享鸟窝
一个哈希桶、两个哈希函数
插入:
- 值x存在哈希表中,直接返回;
- 插入后空间不够,先进行扩容,再rehash
- 用哈希函数 h 1 ( x ) h_1(x) h1(x)计算处下标 i 1 i_1 i1,当 b u c k e t [ i 1 ] bucket[i_1] bucket[i1]为空,说明鸟巢可用,插入 x x x
- 若 b u c k e t [ i 1 ] bucket[i_1] bucket[i1]不空,用新值 x x x将 b u c k e t [ i 1 ] bucket[i_1] bucket[i1]上的老值 x ′ x' x′踢开(对应小布谷鸟将老蛋踢开,老蛋不会坐以待毙们,继续踢开别的蛋),老蛋 x ′ x' x′下一个位置用 h 2 ( x ) h_2(x) h2(x)寻找
- 重复2,直到达到最大循环次数MaxLoop(插入失败);或者所有的值都找到新位置(插入完成)
查找:
去两个可能的巢穴寻找,即去下标 h 1 ( x ) h_1(x) h1(x)和 h 2 ( x ) h_2(x) h2(x)寻找,若没有匹配,则不存在。