Java HashMap

最新推荐文章于 2024-07-04 10:00:00 发布

walk2world-

最新推荐文章于 2024-07-04 10:00:00 发布

阅读量157

点赞数

CC 4.0 BY-SA版权

分类专栏： java 文章标签： hava hashmap

本文链接：https://blog.youkuaiyun.com/sinat_15532547/article/details/88897794

java 专栏收录该内容

5 篇文章

订阅专栏

初始化

hashmap在新建实例时，会对2个参数进行初始化（如果没有指定）：capacity（数组容量）、loadFactor（扩容因子）

capacity这个参数比较有意思，它指的是内部Node数组的长度，但它绝对不是整个hashMap保存数据的上限。理论上是可以达到Integer.MAX_VALUE。当新建实例通过构造器传入这个参数的时，总会将capacity 设置为大于或等于传入参数最近的一个 2的N次方。比如传入15，则capacity会设置为16（16= $2^4$ ）每次扩容也会是成倍的扩容。这里贴一下源码中关于capacity计算的实现代码：

 static final int tableSizeFor(int cap) {
        int n = cap - 1;
        n |= n >>> 1;
        n |= n >>> 2;
        n |= n >>> 4;
        n |= n >>> 8;
        n |= n >>> 16;
        return (n < 0) ? 1 : (n >= MAXIMUM_CAPACITY) ? MAXIMUM_CAPACITY : n + 1;
	}

loadFactor 这个是扩容因子，默认为0.75，这个参数是用来计算threshold的。基本不会独立使用

threshold 这个内部成员变量是同过loadFactor确定的，hashmap通过判断size是否大于threshold来判断是不是要开始扩容了。

hashmap的容量和扩容因子和ArrayList的不一样，并非一个元素就必须占用数组的一个位置，hashmap中可以多个元素公用一个位置，所以，loadFactor 可以设置的非常高类似999，当然你需要知道你这样做的后果

内部数据结构

hashmap内部使用Node来对数据进行封装，维护一个Node的数组，根据数据的hashcode进行mask计算得到下标，并将经过Node封装的数据保存在数组的该下标处。

如果不同的数据计算之后得出同一个下标呢？我们称这种情况叫Hash碰撞，这个时候就体现外面封装这一层的作用了，如果遇到下标相同的数据，会从当前节点伸出一个分支，用来保存数据形成一个小链表的形式。

这个时候另外一个问题就出现了，万一这个hashmap保存的数据Hash碰撞及其严重，80%的数据hashcode都是一样的。如果使用链表保存的话，这就违背我们使用Map的初衷了。hashmap会在当前链表长度超过8（源码中定义的静态变量 TREEIFY_THRESHOLD）时，将链表转换为红黑树以提升这种情况下的查询效率，但是这是有代价的，树结构的节点占用内存基本上是普通节点的2倍大小（注意是除开内部封装的数据），并不适合所有的节点都转化为树形节点，所以在数的节点数小于6（源码定义的静态变量UNTREEIFY_THRESHOLD）时，会将树形节点转换为普通节点，从红黑树转到链表

链表转换为红黑树

在这里插入图片描述

内部数组扩容

hashmap 扩容的时候，会创建一个新的数组，用来保存数据，每次扩容都是之前的2倍

newCap = oldCap << 1

对于Node数组上只有一个元素的情况，将元素按照index 的计算方式e.hash & (newCap -1)计算出一个0到newCap-1的一个值，然后将元素放置于此。

当Node数组上是一个链表的时候，会先把原来的链表分裂成高位和地位两个链表，比如数组长度为16，index为8的元素已经形成了一个链表L，当数组扩容之后，长度变为32，此时，L中的每个元素 e.hash & oldCap只会得到8 或者24的结果，这样就把一个链表分裂成两个mask计算结果相同的链表，然后再将这两个链表的head放在数组对应的位置上即可。