HashSet 扩容的底层机制说明

原创于 2025-03-04 17:07:47 发布 · 526 阅读

2 ·

CC 4.0 BY-SA版权

文章标签：

#java #开发语言

1.扩容机制说明

2.底层机制说明

1.扩容机制说明

扩容机制：

HashSet的底层就是HashMap（底层是数组+链表/红黑树)，当添加元素时先得到其hash值再转换成索引，找到存取数据的table，看这个位置是否已经存放了元素，如果没有，则直接存放，如果有，调用equals后看是否相同，如果不相同，则放在则添加到最后，相同则放弃添加。在Java8中一条链表的元素个数达到默认值8，并且table数组的长度大于等于64，则会进行树化。

扩容机制的细节：

1.HashSet的底层就是HashMap，第一次添加元素时，table数组会扩容到16，加载因子是0.75，临界值是16*0.75==12（当HashSet里的元素超过12时就会进行第二次扩容）。

2.每次扩容table都是上一次容量*2（第一次除外），临界值是扩容后的容量*0.75。

3.在Java8中一条链表的元素个数达到默认值8，并且table数组的长度大于等于64，则会进行树化。否则继续按照table扩容机制进行扩容。（每次扩容table都是上一次容量*2）

2.底层机制说明

public class HashSetSource {
    public static void main(String[] args) {
        HashSet hashSet = new HashSet();
        hashSet.add("java");//到此位置，第 1 次 add 分析完毕. hashSet.add("php");//到此位置，第 2 次 add 分析完毕
        hashSet.add("java");
        System.out.println("set=" + hashSet);

          //1. 执行 HashSet ()
//        public HashSet() {
//            map = new HashMap<>();
//        }
          //2. 执行 add ()
//        public boolean add (E e){//e = "java"
//            return map.put(e, PRESENT) == null;//(static) PRESENT = new Object();
//        }
          //3. 执行 put (), 该方法会执行 hash(key) 得到 key 对应的 hash 值 算法 h = key.hashCode()) ^(h >>> 16)
//        public V put (K key, V value){//key = "java" value = PRESENT 共享
//            return putVal(hash(key), key, value, false, true);
//        }
          //4. 执行 putVal
//        final V putVal ( int hash, K key, V value,boolean onlyIfAbsent, boolean evict){
//            Node<K, V>[] tab;
//            Node<K, V> p;
//            int n, i; //定义了辅助变量table 就是 HashMap 的一个数组，类型是 Node[]
                        // if 语句表示如果当前 table 是 null, 或者 大小=0
                        //就是第一次扩容，到 16 个空间. if ((tab = table) == null || (n = tab.length) == 0)
//            n = (tab = resize()).length;
             //(1)根据 key，得到 hash 去计算该 key 应该存放到 table 表的哪个索引位置并把这个位置的对象，赋给 p
             //(2)判断 p 是否为 null
             //(2.1) 如果 p 为 null, 表示还没有存放元素, 就创建一个 Node (key="java",value=PRESENT)
             //(2.2) 就放在该位置 tab[i] = newNode(hash, key, value, null)
//            if ((p = tab[i = (n - 1) & hash]) == null)
//                tab[i] = newNode(hash, key, value, null);
//            else {
                   //如果当前索引位置对应的链表的第一个元素和准备添加的 key 的 hash 值一样
                   //并且满足 下面两个条件之一:
                   //(1) 准备加入的 key 和 p 指向的 Node 结点的 key 是同一个对象
                   //(2) p 指向的 Node 结点的 key 的 equals() 和准备加入的 key 比较后相同就不能加入
//            if (p.hash == hash &&((k = p.key) == key || (key != null && key.equals(k))))
//                  e = p;
              //再判断 p 是不是一颗红黑树, //如果是一颗红黑树，就调用 putTreeVal , 来进行添加
//            else if (p instanceof TreeNode)
//                 e = ((TreeNode<K, V>) p).putTreeVal(this, tab, hash, key, value);
//            else {//如果 table 对应索引位置，已经是一个链表, 就使用 for 循环比较
                    //(1) 依次和该链表的每一个元素比较后，都不相同, 则加入到该链表的最后
                    //注意在把元素添加到链表后，立即判断 该链表是否已经达到 8 个结点, 就调用 treeifyBin() 对当前这个链表进行树化(转成红黑树)
                    //注意，在转成红黑树时，要进行判断, 判断条件
//                    if (tab == null || (n = tab.length) < MIN_TREEIFY_CAPACITY(64))
//                        resize();
                    //如果上面条件成立，先 table 扩容. // 只有上面条件不成立时，才进行转成红黑树
                    //(2) 依次和该链表的每一个元素比较过程中，如果有相同情况,就直接 break
//                    for (int binCount = 0; ; ++binCount) {
//                        if ((e = p.next) == null) {
//                            p.next = newNode(hash, key, value, null);
//                            if (binCount >= TREEIFY_THRESHOLD(8) - 1) // -1 for 1st
//                                treeifyBin(tab, hash);
//                            break;
//                        }
//                        if (e.hash == hash &&((k = e.key) == key || (key != null && key.equals(k))))
//                            break;
//                        p = e;
//                    }
//                }
//                if (e != null) { // existing mapping for key
//                    V oldValue = e.value;
//                    if (!onlyIfAbsent || oldValue == null)
//                        e.value = value;
//                    afterNodeAccess(e);
//                    return oldValue;
//                }
//            }
//            ++modCount;
              //size 就是我们每加入一个结点 Node(k,v,h,next), size++
//            if (++size > threshold)
//                resize();//扩容
//            afterNodeInsertion(evict);
//            return null;
//        }
//    }
    }
}

以上为我个人的小分享，如有问题，欢迎讨论！！！

都看到这了，不如关注一下，给个免费的赞