Java HashMap

初始化

hashmap在新建实例时,会对2个参数进行初始化(如果没有指定):capacity(数组容量)、loadFactor(扩容因子)

capacity这个参数比较有意思,它指的是内部Node数组的长度,但它绝对不是整个hashMap保存数据的上限。理论上是可以达到Integer.MAX_VALUE。当新建实例通过构造器传入这个参数的时,总会将capacity 设置为大于或等于传入参数最近的一个 2的N次方。比如传入15,则capacity会设置为16(16=242^424)每次扩容也会是成倍的扩容。这里贴一下源码中关于capacity计算的实现代码:

 static final int tableSizeFor(int cap) {
        int n = cap - 1;
        n |= n >>> 1;
        n |= n >>> 2;
        n |= n >>> 4;
        n |= n >>> 8;
        n |= n >>> 16;
        return (n < 0) ? 1 : (n >= MAXIMUM_CAPACITY) ? MAXIMUM_CAPACITY : n + 1;
	}

loadFactor 这个是扩容因子,默认为0.75,这个参数是用来计算threshold的。基本不会独立使用

threshold 这个内部成员变量是同过loadFactor确定的,hashmap通过判断size是否大于threshold来判断是不是要开始扩容了。

hashmap的容量和扩容因子和ArrayList的不一样,并非一个元素就必须占用数组的一个位置,hashmap中可以多个元素公用一个位置,所以,loadFactor 可以设置的非常高 类似999,当然你需要知道你这样做的后果

内部数据结构

hashmap内部使用Node来对数据进行封装,维护一个Node的数组,根据数据的hashcode进行mask计算得到下标,并将经过Node封装的数据保存在数组的该下标处。

如果不同的数据计算之后得出同一个下标呢?我们称这种情况叫Hash碰撞,这个时候就体现外面封装这一层的作用了,如果遇到下标相同的数据,会从当前节点伸出一个分支,用来保存数据形成一个小链表的形式。

这个时候另外一个问题就出现了,万一这个hashmap保存的数据Hash碰撞及其严重,80%的数据hashcode都是一样的。如果使用链表保存的话,这就违背我们使用Map的初衷了。hashmap会在当前链表长度超过8(源码中定义的静态变量 TREEIFY_THRESHOLD)时,将链表转换为红黑树以提升这种情况下的查询效率,但是这是有代价的,树结构的节点占用内存基本上是普通节点的2倍大小(注意是除开内部封装的数据),并不适合所有的节点都转化为树形节点,所以在数的节点数小于6(源码定义的静态变量UNTREEIFY_THRESHOLD)时,会将树形节点转换为普通节点,从红黑树转到链表

链表转换为红黑树

在这里插入图片描述

内部数组扩容

hashmap 扩容的时候,会创建一个新的数组,用来保存数据,每次扩容都是之前的2倍

newCap = oldCap << 1

对于Node数组上只有一个元素的情况,将元素按照index 的计算方式e.hash & (newCap -1)计算出一个0到newCap-1的一个值,然后将元素放置于此。

当Node数组上是一个链表的时候,会先把原来的链表分裂成高位和地位两个链表,比如数组长度为16,index为8的元素已经形成了一个链表L,当数组扩容之后,长度变为32,此时,L中的每个元素 e.hash & oldCap只会得到8 或者24的结果,这样就把一个链表分裂成两个mask计算结果相同的链表,然后再将这两个链表的head放在数组对应的位置上即可。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值