HashMap

最新推荐文章于 2024-08-30 09:03:16 发布

最新推荐文章于 2024-08-30 09:03:16 发布 · 149 阅读

文章标签：

#hashmap #数据结构

java容器专栏收录该内容

6 篇文章

订阅专栏

本文深入解析HashMap的数据结构，包括其数组+链表的底层实现、数据容量调整机制、重构过程及hash算法。通过理解这些核心内容，可以帮助开发者更好地利用HashMap，并有效避免性能瓶颈。

HashMap的数据结构

HashMap的底层数据结构为数组+链表，数组的元素类型为Entry，Entry本身是一个链表结构。在HashMap中可以看到如下的实例变量：
transient Entry[] table;

该变量即定义了HashMap的数据存储。

HashMap的数据容量

HashMap有一个经常被忽略的构造函数：

public HashMap(int initialCapacity, float loadFactor)

参数initialCapacity定义数组table的长度，为2^initialCapacity；参数loadFactor定义装载因子，当HashMap.size()>=table.length*loadFactor时，table就会重构。initialCapacity的默认值为16，loadFactor的默认值为0.75，loadFactor越大，越节约内存，数组重组的概率越小，但hash冲突越高。

HashMap的重构

重构发生在HashMap.size()>=table.length*loadFactor时，得做两件事情：

1、构建新数组，长度为原长度的2倍；

2、对原数组中的元素重新逐个hash并存储到新数组中。

HashMap的hash算法

HashMap对key进行hash，然后将hash值和数组长度进行&运算，从而定位出数组table的下标i，在table[i]上存储的是链表Entry，遍历该链表，通过比较来判断该key是否存在。具体如下：

1、计算key的hashcode，int h=key.hashCode();

2、计算key在HashMap中的hashcode，int hm=hash(h);

           static int hash(int h) {
       h ^= (h >>> 20) ^ (h >>> 12);
       return h ^ (h >>> 7) ^ (h >>> 4);
      }

3、计算key的数组下标，int i=indexFor(hm);

           static int indexFor(int h, int length) {
       return h & (length-1);
           }

4、遍历链表table[i]判断key的存在性

            int hash = hash(key.hashCode());
      for (Entry<K,V> e = table[i]; e != null; e = e.next) {
              if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {

//找到，存在

}

总结：

要用好HashMap必须尽量避免数组重构和尽量减小hash冲突，但二者又是相互矛盾的，使用时得综合考虑，找到一个平衡点(loadFactor).