jdk1.8的Hashtable源码解析

最新推荐文章于 2021-10-21 16:06:12 发布

qq_29864971

最新推荐文章于 2021-10-21 16:06:12 发布

阅读量2k

点赞数

CC 4.0 BY-SA版权

分类专栏： Java集合学习笔记文章标签： Hashtable源码 jdk1.8

本文链接：https://blog.youkuaiyun.com/qq_29864971/article/details/79326106

Java集合学习笔记专栏收录该内容

2 篇文章

订阅专栏

本文详细解析了Hashtable的内部结构、重要变量及方法，对比了它与HashMap的主要区别。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Hashtable声明

public class Hashtable<K,V> extends Dictionary<K,V> implements Map<K,V>, Cloneable, java.io.Serializable
Hashtable继承于Dictionary类（Dictionary类声明了操作键值对的接口方法），实现Map接口（定义键值对接口）；
Hashtable大部分方法都加了synchronized关键字，所以虽然是线程安全的，但在多线程并发环境下的效率较低。
1、Hashtable的几个重要变量
private transient Entry<?,?>[] table：键值对/Entry数组，每个Entry本质上是一个单向链表的表头
private int threshold：rehash阈值，当超过该阈值会rehash（重排序）
private float loadFactor：装填因子
private transient int modCount = 0： Hashtable结构化修改次数，用来实现fail-fast机制；
private transient volatile Set<Map.Entry<K,V>> entrySet：键值对集合，不可重复；
private transient volatile Set<K> keySet：key的集合，不可重复；
private transient volatile Collection<V> values：value集合，可重复；
private static final int Max_ARRAY_SIZE = Integer.MAX_VALUE-8;：散列表容量经过n次扩容之后，设置上限的阈值
2、Hashtable的几个内部类
键值对—Entry
private static class Entry<K,V> implements Map.Entry<K,V> {
    final int hash;    //哈希值
    final K key;       //key
    V value;           //value
    Entry<K, V> next;  //下一个entry结点
    ...
    // 计算键值对的hashCode
    public int hashCode() {
        // "^" 按位异或, hash在调用构造器时传入
        return hash ^ Objects.hashCode(value);
    }
}

Value集合——ValueCollection

private class ValueCollection extends AbstractCollection<V> {

public Iterator<V> iterator() {

return getIterator(VALUES);

}

public int size() {

returncount;

}

public boolean contains(Object o) {

return containsValue(o);

}

public void clear() {

Hashtable.this.clear();

}

EntrySet集合

private class EntrySet extendsAbstractSet<Map.Entry<K,V>> {

public Iterator<Map.Entry<K,V>>iterator() {

return getIterator(ENTRIES);

}

publicboolean add(Map.Entry<K,V> o) {

returnsuper.add(o);

}

......

}

Keys集合

private class KeySet extendsAbstractSet<K> {
        public Iterator<K> iterator() {
            return getIterator(KEYS);
        }
        publicint size() {
            returncount;
        }
        public boolean contains(Object o) {
            return containsKey(o);
        }
        public boolean remove(Object o) {
            return Hashtable.this.remove(o) != null;
        }
        publicvoid clear() {
            Hashtable.this.clear();
        }
    }
3、Hashtable几个重要的方法分析
     主要方法：Hashtable()、contains()、get()、rehash()、addEntry()、put(K,V)、remove(Object)，像size()、keys()、values()、isEmpty()、elements()比较简单就不一一介绍了。
(1) Hashtable
public Hashtable(int initialCapacity, float loadFactor) {
        if (initialCapacity < 0)
            throw new IllegalArgumentException("Illegal Capacity: "+ initialCapacity);
        if (loadFactor <= 0 || Float.isNaN(loadFactor))
            throw new IllegalArgumentException("Illegal Load: "+loadFactor);
        if (initialCapacity==0)
            initialCapacity = 1;
        this.loadFactor = loadFactor;
        table = new Entry<?,?>[initialCapacity];
        threshold = (int)Math.min(initialCapacity * loadFactor, MAX_ARRAY_SIZE + 1);
//threshold的计算方式，MAX_ARRAY_SIZE防止经过n次扩容后，数组大小超出整数的最大值，所以这里设定一个上限的阈值
}
   public Hashtable() {
         this(11, 0.75f); //默认的table容量为11，装载因子为0.75
}
(2) contains
public synchronized boolean contains(Object value) {
    if (value == null) {    //Hashtable的value不允许为空，不然会报空指针
                thrownew NullPointerException();
    }
            Entry<?,?> tab[] = table;
            //从数组的最后往前遍历
            for (int i = tab.length ; i-- > 0 ;) {
            //再对每个entry链表进行遍历
                for (Entry<?,?> e = tab[i] ; e != null ; e = e.next) {
            //如果找到对应的value，返回true
                   if (e.value.equals(value)) {
                       return true;
                   }
                }
            }
            //没找到返回false
            return false;
}
(3) containsKey
public synchronized boolean containsKey(Object key) {
            Entry<?,?> tab[] = table;
            int hash = key.hashCode();
            //计算数组的索引，Hashtable本质上采用除数取余法进行散列分布
            int index = (hash & 0x7FFFFFFF) %tab.length;
            for (Entry<?,?> e = tab[index] ; e != null ; e = e.next) {
                if ((e.hash == hash) && e.key.equals(key)){
                   return true;
                }
            }
            return false;
}
(4) get
public synchronized V get(Object key) {
            Entry<?,?> tab[] = table;
            int hash = key.hashCode();
            //通过key的hash值和table的length，经过运算得到散列表中的索引
            int index = (hash & 0x7FFFFFFF) %tab.length;
            //遍历tab[index]对应的链表
            for (Entry<?,?> e = tab[index] ; e != null ; e = e.next) {
            //如果entry的key和hash值与期望值一致，则返回
                if ((e.hash == hash) && e.key.equals(key)){
                   return (V)e.value;
                }
            }
            //否则返回空值
            return null;
}
(4) rehash
@SuppressWarnings("unchecked")
        protectedvoid rehash() {
            //保存旧的容量和Entry数组
            int oldCapacity = table.length;
            Entry<?,?>[] oldMap = table;
            //定义新值，新的容量为旧值的2倍加1
            int newCapacity = (oldCapacity << 1) + 1;
            //判断新的容量是否超过了上限
            if (newCapacity - MAX_ARRAY_SIZE > 0) {
                if (oldCapacity == MAX_ARRAY_SIZE)
                   return;
                newCapacity = MAX_ARRAY_SIZE;
            }
            //定义新的数组
            Entry<?,?>[] newMap = new Entry<?,?>[newCapacity];
            //此时，散列表内的元素发生变化，modCount指针加1
            modCount++;
            //重新计算新的threshold
            threshold = (int)Math.min(newCapacity * loadFactor, MAX_ARRAY_SIZE+ 1);
            table = newMap;

            //对散列表内的所有元素进行“重排列”，顺序从后往前
            for (int i = oldCapacity ; i-- > 0 ;) {
                //遍历oldMap[i]对应的entry链表
                for (Entry<K,V> old = (Entry<K,V>)oldMap[i]; old != null ; ) {
                   Entry<K,V> e = old;
                   old = old.next;
                //计算新数组的索引值
                   int index = (e.hash & 0x7FFFFFFF) %newCapacity;
               //先插入起始值
                   e.next = (Entry<K,V>)newMap[index];
                //对应的向右侧移动
                   newMap[index] = e;
                /**
                * 可能e.next = (Entry<K,V>)newMap[index];和newMap[index] = e;比较生硬，我们举例说明
                * 第一次遍历时，newMap[index]为null,所以 e.next=null
                * 第二次遍历时，假定e1=e.next, 然后 e1.next = e, newMap[index] = e1（起始点为e1）
                * ...
                * 依次进行，会发现链表中插入元素的顺序是“从左往右”
                */
                }
            }
}
(5) addEntry
private void addEntry(int hash, K key, V value, int index) {
            //modCount指针，对于修改操作不会自增，而对于内部元素数量的变化会自增
               modCount++;
               Entry<?,?> tab[] = table;
               //如果count大于阈值
               if (count >= threshold) {
                   //进行重排列操作
                    rehash();
                    tab = table;
                    hash = key.hashCode();
                    index = (hash & 0x7FFFFFFF) %tab.length;
               }
               //如果不大于阈值，则直接插入
               @SuppressWarnings("unchecked")
               Entry<K,V> e = (Entry<K,V>) tab[index];
               //如果e为空，将插入到起始位置，如果e不为空，则从左向右插入
          tab[index] = new Entry<>(hash, key, value, e);
                count++;
      }
(6) put
下图为jdk1.8的hashMap的put方法的过程，Hashtable和其类似，基本上“计算索引，逻辑判断”这个部分是一致的，差别在于Hashtable中没有用到红黑树。

public synchronized V put(K key, V value) {
            // 首先value不能为空
            if (value == null) {
                throw new NullPointerException();
            }
            Entry<?,?> tab[] = table;
            int hash = key.hashCode();
            int index = (hash & 0x7FFFFFFF) %tab.length;
            @SuppressWarnings("unchecked")
            //判断tab[index]是否已经有值
            Entry<K,V> entry = (Entry<K,V>)tab[index];
            //如果有值，则遍历
            for(; entry != null ; entry = entry.next) {
                //如果key重复，那么新的value覆盖旧值
                if ((entry.hash == hash) &&entry.key.equals(key)) {
                   V old = entry.value;
                   entry.value = value;
                   return old;
                }
            }
            //经过遍历，发现key并没有重复，进行插入操作
            addEntry(hash, key, value, index);
            return null;
   }
(7) remove
public synchronized V remove(Object key) {
            Entry<?,?> tab[] = table;
            int hash = key.hashCode();
            //计算索引
            int index = (hash & 0x7FFFFFFF) %tab.length;
            @SuppressWarnings("unchecked")
            //获得索引位置对应的Entry链表
            Entry<K,V> e = (Entry<K,V>)tab[index];
            //遍历链表中的entry元素
            for(Entry<K,V> prev = null ; e != null ; prev = e, e = e.next) {
                //如果找到需要的entry，进行删除
                if ((e.hash == hash) &&e.key.equals(key)) {
                   //修改指针加1
                   modCount++;
                   //如果prev结点非空
                   if (prev != null) {
                       //那么pre结点的next指针指向e的next,等价于e被删除
                       prev.next = e.next;
                   } else {
                       //否则，说明需要删除的为起始结点
                       tab[index] = e.next;
                   }
                   count--;
                   V oldValue = e.value;
                   e.value = null;
                   return oldValue;
                }
            }
            return null;
}
HashMap和Hashtable的区别
HashMap是非线程安全的，Hashtable是线程安全的，所以Hashtable重量级一些，因为使用了synchronized关键字来保证线程安全。
HashMap允许key和value都为null，而Hashtable都不能为null。
Hashtable继承自 JDK 1.0 的 Dictionary 虚拟类，而HashMap是 JDK 1.2 引进的 Map 接口的一个实现。
Hashtable和HashMap扩容的方法不一样，Hashtable中数组默认大小11，扩容方式是 old*2+1。HashMap中数组的默认大小是16，而且一定是2的指数，增加为原来的2倍。
两者通过hash值散列到hash表的算法不一样，Hashtable是古老的除留余数法，直接使用Object的hashcode，而后者是强制容量为2的幂，重新根据hashcode计算hash值，在使用hash和（hash表长度 – 1）进行与运算，也等价取膜，但更加高效，取得的位置更加分散，偶数，奇数保证了都会分散到。前者就不能保证。
HashMap的迭代器(Iterator)是fail-fast迭代器，而Hashtable的enumerator迭代器不是fail-fast的。所以当有其它线程改变了HashMap的结构（增加或者移除元素），将会抛出ConcurrentModificationException，但迭代器本身的remove()方法移除元素则不会抛出ConcurrentModificationException异常。以下面测试case为例：

    //测试Hashtable是否是“fast-fail"机制
    @Test
    public void test2() {
        Hashtable<String,String> table = new Hashtable<String,String>();
        table.put("a", "gao");
        table.put("b", "zhu");
        table.put("c", "zhang");
        table.put("d", "sun");

        Iterator<String> keys =table.keySet().iterator();
        while(keys.hasNext()) {
            String s = keys.next();
            if("c".equals(s)) {
                table.remove(s);
            }else {
                System.out.println(s);
            }
        }
    }
    //测试HashMap是否是"fast-fail"机制
    @Test
    public void test3() {
        Map<String,String> table2 = new HashMap<String,String>();
        table2.put("a", "gao");
        table2.put("b", "zhu");
        table2.put("c", "zhang");
        table2.put("d", "sun");

        Iterator<String> keys =table2.keySet().iterator();
        while(keys.hasNext()) {
            String s = keys.next();
            if("c".equals(s)) {
                table2.remove(s);
            }else {
                System.out.println(s);
            }
        }
    }
结果发现：Hashtable不会报ConcurrentModificationException异常，而HashMap会！说明Hashtable的enumerator迭代器不是遵循fail-fast机制的。