Set接口实现类—HashSet

最新推荐文章于 2025-12-02 18:57:44 发布

原创最新推荐文章于 2025-12-02 18:57:44 发布 · 78 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#java #数据结构

HashSet基于HashMap实现，允许存储null值但不允许重复元素。初始容量为16，扩容阈值为12（0.75加载因子）。添加元素时，通过hash值确定索引，如果索引已有元素，则用equals方法检查是否相同。当链表达到8个节点且table容量大于64时，会转换为红黑树。文章通过源码分析解释了HashSet的添加过程和扩容策略。

Hashset概述

Hashset实现了Set接口

Hashset实际上是HashMap，看源码

 public HashSet() {
        map = new HashMap<>();
    }

可以存放 null 值，但只能有一个
Hashset不保证元素是有序的，取决于hash后，再确定索引的结构。（即，不保证存放元素的顺序和取出一致）
不能有重复元素/对象。

HashSet扩容机制

HashSet 底层是HashMap，第一次添加时，table数组扩容到 16，临界值（threshold）是16*加载因子（loadFactor）是0.75 = 12
添加一个元素时，先得到hash值，转换为索引值
找到存储数据表的table，看这个索引位置是否已经存放有元素
如果没有，直接加入
如果有，调用 equals 方法比较，如果相同，就放弃添加，如果不相同，则添加到最后。注意：这里的 equals 方法不能单纯的认为是比较内容，是由程序员决定的，可以进行方法重写。
如果table数组使用到了临界值 12，就会扩容到16*2 = 32，新的临界值就是32*0.75 = 24，依次类推。
在JAVA8中，如果一条链表的元素个数到达 TREEIFY_THRESHOLD（默认是8），并且table大小大于等于 MIN_TREEIFY_CAPACITY（默认是64），就会进行树化（红黑树），否则仍然采用数组扩容机制。

举例进行源码分析

public class HashSetSource {
    public static void main(String[] args) {
        HashSet hashSet = new HashSet();
        hashSet.add("java");
        hashSet.add("php");
        hashSet.add("java");
        System.out.println("hashset: "+hashSet); //hashset: [java, php]

        /*
        HashSet 源码解读
          1、执行HashSet()
          源码：public HashSet(){
                 map = new HashMap<>();
               }

          2、 执行add()
            public boolean add(E e) { // e="java"
            return map.put(e, PRESENT)==null; //PRESENT没什么意义，表示占位的意思
            }

          3、 执行put(), 该方法会执行hash(key)方法 得到key对应的hash值  算法：(h = key.hashCode()) ^ (h >>> 16)
              public V put(K key, V value) { //key="java"  value= PRESENT (始终都是)
            return putVal(hash(key), key, value, false, true);
            }

          4、 执行 putVal
              final V putVal(int hash, K key, V value, boolean onlyIfAbsent,boolean evict)
            {
               Node<K,V>[] tab; Node<K,V> p; int n, i;   //定义了辅助变量
               // table 就是HashMap的一个数组，类型是 Nodep[]
               // if 语句表示如果当前table 是null，或者大小=0，就是第一次扩容，扩容到16个空间
               if ((tab = table) == null || (n = tab.length) == 0)
               n = (tab = resize()).length;
               // 根据key，得到hash，去计算key应该存放到table表的哪个索引位置 i，并把这个位置的对象赋给变量 p
               // 判断 p 是否为null
               // 如果是null，表示索引 i 这个位置还没有存放元素，就创建一个Node (key="java",value=PRESENT)
               // 就放在该位置  table[i] = newNode(hash, key, value, null);
               if ((p = tab[i = (n - 1) & hash]) == null)
               tab[i] = newNode(hash, key, value, null);
               else
             {
                  Node<K,V> e; K k;
                  //如果当前索引位置对应的链表的第一个元素和准备添加的key的hash值一样
                  //并且满足下面两个条件之一：
                  // 1、准备加入的 key 和 p 指向的Node结点的 key 是同一个对象
                  // 2、p指向的Node结点的 key 的equals() 和准备加入的key比较后是相同的
                  // 就不能加入
                  if (p.hash == hash &&((k = p.key) == key || (key != null && key.equals(k))))
                      e = p;
                  //判断 p 是不是一个红黑树，如果是一颗红黑树，就调用 putTreeVal ，来进行添加
                  else if (p instanceof TreeNode)
                      e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
                  else
                 { // 如果table对应索引位置，已经是一个链表，就使用for循环来进行比较
                   // 依次和该链表的每一个元素比较后，都不相同，则加入到该链表的最后
                   // 注意：在把元素添加到链表后，立即判断：该链表是否已经达到8个结点
                   //      是的话，就调用treeifyBin() 对当前这个链表进行树化(转成红黑树)
                   // 注意：在转成红黑树时，要进行判断，判断条件：
                   //  if (tab == null || (n = tab.length) < MIN_TREEIFY_CAPACITY)
                   //       resize();
                   // 如果上面条件成立，先对数组table进行扩容
                   // 只有上面条件不成立时，才进行转成红黑树
                   // 依次和该链表的每一个元素比较过程中，如果有相同情况，就直接break
                    for (int binCount = 0; ; ++binCount)
                   {
                      if ((e = p.next) == null)
                      {
                        p.next = newNode(hash, key, value, null);
                        if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
                            treeifyBin(tab, hash);
                        break;
                       }
                      if (e.hash == hash &&((k = e.key) == key || (key != null && key.equals(k))))
                        break;
                    p = e;
                   }
                 }
              if (e != null)
             { // existing mapping for key
                V oldValue = e.value;
                if (!onlyIfAbsent || oldValue == null)
                    e.value = value;
                afterNodeAccess(e);
                return oldValue;
             }
           }
        ++modCount;
        if (++size > threshold) //每加入一个结点Node，size就会加一， size > 12 就进行扩容
            resize(); //扩容方法
        afterNodeInsertion(evict); //空方法
        return null; //返回null，代表成功了
    }

         */


    }
}