随机的力量(1) - The power of random two choices

水滴杂谈

于 2015-11-01 00:43:52 发布

阅读量3.1k

点赞数 1

CC 4.0 BY-SA版权

分类专栏：算法数学文章标签： hash random 随机算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/three_body/article/details/49538777

本文探讨了哈希函数中冲突的问题，提出了随机选取两个桶并选择链表较短者插入的方法来减少冲突链表的最大长度。实验表明，这种随机双选择策略能显著优于单一随机选择，详细研究可在相关论文中找到。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

我们都知道对于哈希函数来说，有一个绕不开的话题就是冲突。当N个object通过随机函数映射到N个桶的时候，可能由于冲突而出现Hash(x) = Hash(y)的情况。经典的处理哈希冲突的方法包括链表法(Separate Chaining)和开放寻址(Open Addressing)。对于链表法来说，冲突位置的链表长度越长，算法效率越差。

问题1：如果N个Object随机哈希到N个桶，最大链表长度可能是多少呢？

答案： log N / log log N

问题2：如果每次选择哈希映射的桶时，随机两次挑出两个桶，并从中选择链表长度相对更短的桶插入呢？

问题3：如果每次选择哈希映射的桶时，随机D次呢？

答案：log log N / log D + 1

对比上述两个结果log N / log log N, log log N/log D + 1, 可以明显看出从随机选取一个桶，到随机选取两个桶并择优决定，能够显著地减少冲突链表最大长度。

下面让我们直观地观察模拟实验的效果

最低0.47元/天解锁文章

200万优质内容无限畅学

博客等级

码龄12年

37
原创

11
点赞

29
收藏

35
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

上一篇：: [Leetcode.python] 002. Add Two Numbers

下一篇：: 随机的力量(2) - 矩阵比较

最新评论

深度学习(Deep Learning) 学习资料
MilkLeong: 楼主你好，请问你有Deep learning of representations, AAAI 2013 - Bengio 这篇文章的PDF吗，我科学上网也打不开链接，能否分享一下表情包
明天太阳照常升起的概率是多少？
大号小白兔: 感谢博主分享
文本索引与检索
littlecrab123: 关于文本检索，我之前听朋友说过dtSearch Engine。说是I全球领先的文本检索工具控件。我进网站一看确实比较强大，不过不是开源的，要收费。
写给妹妹的编程札记 6 - 搜索实战: 单词博弈
expectances: 我觉得你的算法很好，讲解也很透彻，非常感谢。不过我觉得“考虑下，搜索树中可能的字母序列数目是多少呢？……”这一段，好像有点没表述到位。这么说是否合适：对任一输入，如果字符串长度为k，则非空子串的个数为2^k-1。如果给原字符串的每位字符加上一个权值，从右到左为1、2、4、8、……、2^k-1，得到一个k位的二进制数；则各子串对应的值互不相同。从而可以申请一个含有2^k-1个元素的数组v[0:2^k-1]，该数组的每个下标对应一个子串，该下标处的值（除v[0]外）表示一个子串的运算结果，其中v[0]对应空串不起作用——也可以记录最终结果。…… 当然，这不重要，只是刚看的时候有点迷惘，啰嗦一下。看了你算法，受益良多，再次感谢。.
出自上帝之手的精妙算法 - Algorithm from THE BOOK (1)
feliciafay: Thanks, 学习了~

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。