学习Java之Hashmap的扰动函数
先来看个例子 :( 65535 * i + 1234 ) % 65535 。在整体不唱过int上限的情况下,无论i是多少,结果都是一个固定值。
这种hash的结果是最差的,因为所有的对象都分配到同一个槽中。
其原因是hash中只有低16位确定分配到数组中的哪个槽,高16位没在分配槽起作用。
那么解决思路就很简单了,那就是在hash过程中,让高位也参与到低位的运算中来。
HashMap中的扰动函数
static final int hash(Object var0) {
int var1;
return var0 == null ? 0 : (var1 = var0.hashCode()) ^ var1 >>> 16;
}
本质:新的32位 = 原高16位 + 原高16位与原低16位异或。
针对上面那种场景,高16位也参与到槽分配运算过程。
那么为什么不用md5?
因为使用这些方法并不经济。
经济是指,扰动函数效果好,cpu运算友好且耗时短。像HashMap这种底层数据结构,执行的效率就决定了很多应用的快慢。
HashMap的扰动函数有什么缺点?
当数字本身低于16位的时候。高16位全为0,此时扰动函数没有起作用,hash的好不好完全取决于低16位。
例如: ( 16 * i + 3 ) % 16,即使对 (16 * i + 3 ) 用HashMap的扰动函数, 此时也只有低4位参与到槽的分配,而低16位中的另外12位都没有参与其中