HashMap初始容量剖析

问题: 确定只装载10个元素, HashMap初始容量多少是最佳?

答案: 16

目的: 防止HashMap频繁扩容,影响性能

解析:

HashMap的底层数据结构是由 数组 和 单向链表 组成

	扩容概念: 当所用数组的长度  大于 初始长度 * 0.75(负载因子)时,数组扩容
		Map<String, String> map = new HashMap<String, String>();
		等同于
		Map<String, String> map = new HashMap<String, String>(16);
		
		初始化容量默认为16,当数组使用超过 16 * 0.75 = 12 时(数组使用第13个元素时)扩容

举例:

	map的初始容量为4,向map中放入6个元素,有可能扩容,有可能不扩容

	如果所用数组长度小于 4 * 0.75 = 3,不扩容

不扩容,数据结构如下:

		由于key的hash值相同,产生碰撞,放入到数组中的同一位置,形成单向链表

不扩容的数据结构

扩容的情况如下:

由于key的hash值不同,放入到数组中的不同位置,当放第四个元素时,HashMap扩容为8

扩容源码如下:
// ++ this.size = 4      this.threshold = 4 * 0.75 = 3
if (++this.size > this.threshold) {
    this.resize();
}

扩容数据结构

假设10个元素寻址运算得到的index都不相同,初始容量应为 10 / 0.75 = 13.3向上取整,初始容量为14,此时不会扩容

通过阅读HashMap源码可知,容量大小为 2 的 n次方.所以应该取第一个大于14 的 2 的 n次方 值,为 16

新的问题: 容量大小为什么必须是 2 的 n次方?14为什么不行??

原因: 避免 哈希桶资源浪费

解析:

 map.put("key","value")时,寻址算法为 length-1 & key.hash --> 13 &  key.hash
    length-1 : 00000000000000000000000000001101
    key1.hash: 11111111111111110000111100000111
    --------------------------------
    00000000000000000000000000000101 = 5

    如果容量为14 , length-1 = 13  , 13的二进制位1101,1101 与别的数值 进行 & 运算, 倒数第二位得到的永远是0,对空间造成浪费,同时会增大hash寻址得到的index相同的概率

    所以length-1 的二进制 应当全部为1,将hash表的长度设为2的N次方

    2的N次方 -1 的二进制全部为1,所有的哈希桶均有被使用的可能

    避免了上述问题,所以初始容量应为16


    其实无论你的HashMap(x)中的x设置为多少,HashMap的大小都是2^n。2^n是大于x的第一个数。因为HashMap的初始化代码中有以下这行代码:
	    static final int tableSizeFor(int var0) {
	        int var1 = var0 - 1;
	        var1 |= var1 >>> 1;
	        var1 |= var1 >>> 2;
	        var1 |= var1 >>> 4;
	        var1 |= var1 >>> 8;
	        var1 |= var1 >>> 16;
	        return var1 < 0 ? 1 : (var1 >= 1073741824 ? 1073741824 : var1 + 1);
	    }
### Java HashMap 初始容量大小与设置初始数组长度 在 Java 中,`HashMap` 的初始容量是一个重要的性能优化参数。当创建 `HashMap` 实例时,可以通过构造函数指定其初始容量以及加载因子。 #### 构造方法分析 通过提供的引用可知,在 `HashMap` 类中在如下构造方法: ```java public HashMap(int initialCapacity) { this(initialCapacity, DEFAULT_LOAD_FACTOR); } ``` 此构造方法接受一个整数类型的参数 `initialCapacity`,表示期望的初始容量[^1]。该值会被传递给另一个重载的构造方法,后者还允许自定义负载因子(load factor)。默认情况下,如果未显式提供负载因子,则会使用默认值 `DEFAULT_LOAD_FACTOR`,通常为 0.75f。 #### 初始容量调整逻辑 为了确保高效储和检索数据,`HashMap` 并不会直接采用用户传入的 `initialCapacity` 值作为底层数组的实际大小。相反,它会对这个值进行一些处理以满足特定需求。具体来说,`HashMap` 需要找到大于等于所请求容量的第一个 2 的幂次方数值,并将其设为最终的数组尺寸。这一操作由以下静态辅助方法完成: ```java static final int tableSizeFor(int cap) { int n = cap - 1; n |= n >>> 1; n |= n >>> 2; n |= n >>> 4; n |= n >>> 8; n |= n >>> 16; return (n < 0) ? 1 : (n >= MAXIMUM_CAPACITY) ? MAXIMUM_CAPACITY : n + 1; } ``` 上述代码片段展示了如何计算最接近且不小于目标容量的一个 2 的幂次方数[^3]。这种设计有助于提升散列分布均匀性和减少碰撞概率,从而改善整体性能表现。 #### 推荐实践 基于经验法则,推荐将 `initialCapacity` 设定得稍高于预期最大条目数量除以预计使用的负载因子的结果。例如,假设计划入约 100 条记录并维持标准负载因子 0.75,则可考虑如下配置: ```java int expectedEntries = 100; float loadFactor = 0.75f; int capacity = Math.max(16, (int)(expectedEntries / loadFactor)); HashMap<String, String> map = new HashMap<>(capacity); ``` 值得注意的是,默认最小容量被限定为 16;因此即使计算得出更低的需求量,实际分配仍至少为此阈值[^2]。 #### 总结 合理规划 `HashMap` 的初始容量能够有效降低动态扩容频率及其伴随的时间开销。遵循最佳实践——即依据估算的数据规模选取适当大小,并优先选用 2 的幂形式——可以帮助构建更加高效的映射结构实例。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值