简单讲一下HashMap中的tableSizeFor()方法的源码,在看源码之前要先知道HashMap的一些特性,例如:HashMap的容量只能是2的幂,最大容量是1<<30
tableSizeFor()的作用是,在HashMap进行给定初始容量的初始化时,将传入的参数(初始容量)修改为2的n次幂,以此来保证HashMap的容量只会是2的幂。也就是说如果传入的参数为x,那么调用该方法应该返回一个大于等于x的最小的2的幂。
下面直接看源码:
/**
* Returns a power of two size for the given target capacity.
*/
static final int tableSizeFor(int cap) {
int n = cap - 1;
n |= n >>> 1;
n |= n >>> 2;
n |= n >>> 4;
n |= n >>> 8;
n |= n >>> 16;
return (n < 0) ? 1 : (n >= MAXIMUM_CAPACITY) ? MAXIMUM_CAPACITY : n + 1;
}
刚开始看的时候一脸懵逼,全是位运算,完全不知道这写的是什么鬼。不过知道方法的作用之后再反过来推导就简单多了。
我们知道这个方法最后要返回的是一个大于等于cap这个变量的一个最小的2的幂。又知道是用二进制位运算实现的。那我们就可以把问题理解成:将cap转换为二进制,并且找到它从左往右数第一个不为零的位,如果第一个不为零的位代表的是2的n次幂,那么方法的返回值就应该是2的n+1次幂。
那么这一堆位运算是怎样得到大于等于cap这个变量的一个最小的2的幂的呢?在思考这个之前,我们先来看一下几个问题:
1.为什么第x次移位运算移的位数都是上一次的两倍?
2.为什么进行了5次移位之后就停止了?
3.移位之前为什么要先减一?
不多bb,直接看下面:
// 10000000 00000000 00000000 00000000
n |= n >>> 1; // 11000000 00000000 00000000 00000000
n |= n >>> 2; // 11110000 00000000 00000000 00000000
n |= n >>> 4; // 11111111 00000000 00000000 00000000
n |= n >>> 8; // 11111111 11111111 00000000 00000000
n |= n >>> 16; // 11111111 11111111 11111111 11111111
我们只关心从左边数第一个不为零的位,其他的位是1是0都不重要。n |= n >>> 1之后可以确保,从左边数第一个不为零的位开始前两位都是1,n |= n >>> 2之后可以确保前四位都是1。以此类推,最后得到的就是从第一个不为零的位开始全为1的数,再将这个数+1就可以得到大于等于cap这个变量的最小的2的幂了。
看到这里,上面的那三个问题也应该明白了吧。
这个 n |= n >>> 1运算有点像是复制,右移1位在做按位或运算可以得到两位1,然后两位一起右移得到四位1。。。。。。最后就全是1了。如果移位的位数小于上一次的两倍,那么在进行或运算的时候就会有“重叠”的部分,效率低。如果移位的位数大于上一次的两倍,那么就会有“漏掉”的部分,就不能确保最后一定全是1。
移位5次就停止是因为HashMap最大容量是1<<30 (2的30次方),是一个int型数据。在java中int型是4个字节也就是32位,除去符号位就是31位,进行5次移位之后已经足以保证31位全为1了。
为什么移位之前先减一?找几个数代进去试试啊。如果传入的参数刚好是2的x次幂,如果不减1计算结果就是2的x+1次幂,显然不对。
最近找了一个实习,没课的时候都在写公司给的项目。这篇博客写到一半之后拖了好久没写,写的可能有点思路不连贯,如果有不对的地方欢迎大佬指正。
原创文章,转载请注明作者及原文链接。