hashmap的hash方法出现原因

最新推荐文章于 2021-09-23 10:21:46 发布

原创最新推荐文章于 2021-09-23 10:21:46 发布 · 1.4k 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#hash #存储 #源码 #hashmap #hashcode

java 专栏收录该内容

25 篇文章

订阅专栏

本文探讨了在HashMap中使用哈希算法的重要性，解释了如何通过哈希函数的处理来避免键值对存储在同一个链表中，从而提高查询效率。通过实例展示了原始与优化后的哈希算法效果对比。

举个栗子你就清楚了。考虑到你已经读过源码，下面一些术语就不详细解释了。
我们创建一个hashmap，其entry数组为默认大小16。
现在有一个key、value的pair需要存储到hashmap里，该key的hashcode是0ABC0000（8个16进制数，共32位），如果不经过hash函数处理这个hashcode，这个pair过会儿将会被存放在entry数组中下标为0处。下标=ABCD0000 & (16-1) = 0。
然后我们又要存储另外一个pair，其key的hashcode是0DEF0000，得到数组下标依然是0。
想必你已经看出来了，这是个实现得很差的hash算法，因为hashcode的1位全集中在前16位了，导致算出来的数组下标一直是0。于是，明明key相差很大的pair，却存放在了同一个链表里，导致以后查询起来比较慢。
hash函数的通过若干次的移位、异或操作，把hashcode的“1位”变得“松散”，比如，经过hash函数处理后，0ABC0000变为A02188B，0DEF0000变为D2AFC70，他们的数组下标不再是清一色的0了。
hash函数具体的做法很简单，你画个图就知道了，无非是让各数位上的值受到其他数位的值的影响。

没看过圣经《计算机程序设计艺术》，仅仅是个人理解，仅供参考。

作者：匿名用户
链接：http://www.zhihu.com/question/20733617/answer/32513376
来源：知乎
著作权归作者所有。商业转载请联系作者获得授权，非商业转载请注明出处。