笔记001--Hashtable/HashMap与key/value为null的关系

本文详细对比了HashMap与Hashtable两种数据结构对于null键值对的处理方式,并解释了背后的原因。通过对源代码的深入分析,揭示了这两种数据结构在实现上的不同之处。
  大家都知道Hashtable与HashMap的三大区别,其中有一条则是HashMap可以存储一个Key为null,多个value为null的元素,但是Hashtable却不可以存储。究竟是为什么?下面看一下源代码:

HashMap.class:

    // 此处计算key的hash值时,会判断是否为null,如果是,则返回0,即key为null的键值对
    // 的hash为0。因此一个hashmap对象只会存储一个key为null的键值对,因为它们的hash值都相同。
    static final int hash(Object key) {
        int h;
        return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
    }
    // 将键值对放入table中时,不会校验value是否为null。因此一个hashmap对象可以存储
    // 多个value为null的键值对
    public V put(K key, V value) {
        return putVal(hash(key), key, value, false, true);
    }
    final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
                   boolean evict) {
        Node<K,V>[] tab; Node<K,V> p; int n, i;
        if ((tab = table) == null || (n = tab.length) == 0)
            n = (tab = resize()).length;
        if ((p = tab[i = (n - 1) & hash]) == null)
            tab[i] = newNode(hash, key, value, null);
        else {
            Node<K,V> e; K k;
            if (p.hash == hash &&
                ((k = p.key) == key || (key != null && key.equals(k))))
                e = p;
            else if (p instanceof TreeNode)
                e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
            else {
                for (int binCount = 0; ; ++binCount) {
                    if ((e = p.next) == null) {
                        p.next = newNode(hash, key, value, null);
                        if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
                            treeifyBin(tab, hash);
                        break;
                    }
                    if (e.hash == hash &&
                        ((k = e.key) == key || (key != null && key.equals(k))))
                        break;
                    p = e;
                }
            }
            if (e != null) { // existing mapping for key
                V oldValue = e.value;
                if (!onlyIfAbsent || oldValue == null)
                    e.value = value;
                afterNodeAccess(e);
                return oldValue;
            }
        }
        ++modCount;
        if (++size > threshold)
            resize();
        afterNodeInsertion(evict);
        return null;
    }

Hashtable.class:

    public synchronized V put(K key, V value) {
        // 确保value不为空。这句代码过滤掉了所有value为null的键值对。因此Hashtable不能
        // 存储value为null的键值对
        if (value == null) {
            throw new NullPointerException();
        }

        // 确保key在table数组中尚未存在。
        Entry<?,?> tab[] = table;
        int hash = key.hashCode(); //在此处计算key的hash值,如果此处key为null,则直接抛出空指针异常。
        int index = (hash & 0x7FFFFFFF) % tab.length;
        @SuppressWarnings("unchecked")
        Entry<K,V> entry = (Entry<K,V>)tab[index];
        for(; entry != null ; entry = entry.next) {
            if ((entry.hash == hash) && entry.key.equals(key)) {
                V old = entry.value;
                entry.value = value;
                return old;
            }
        }

        addEntry(hash, key, value, index);
        return null;
    }

ConcurrentHashMap.class:

    public V put(K key, V value) {
        return putVal(key, value, false);
    }
    final V putVal(K key, V value, boolean onlyIfAbsent) {
        // 在此处直接过滤掉key或value为null的情况
        if (key == null || value == null) throw new NullPointerException();
        // 另外其hash值采用了二次hash,使得hash值分布更均匀。
        int hash = spread(key.hashCode());
        int binCount = 0;
        for (Node<K,V>[] tab = table;;) {
            Node<K,V> f; int n, i, fh;
            if (tab == null || (n = tab.length) == 0)
                tab = initTable();
            else if ((f = tabAt(tab, i = (n - 1) & hash)) == null) {
                if (casTabAt(tab, i, null,
                             new Node<K,V>(hash, key, value, null)))
                    break;                   // no lock when adding to empty bin
            }
            else if ((fh = f.hash) == MOVED)
                tab = helpTransfer(tab, f);
            else {
                V oldVal = null;
                synchronized (f) {
                    if (tabAt(tab, i) == f) {
                        if (fh >= 0) {
                            binCount = 1;
                            for (Node<K,V> e = f;; ++binCount) {
                                K ek;
                                if (e.hash == hash &&
                                    ((ek = e.key) == key ||
                                     (ek != null && key.equals(ek)))) {
                                    oldVal = e.val;
                                    if (!onlyIfAbsent)
                                        e.val = value;
                                    break;
                                }
                                Node<K,V> pred = e;
                                if ((e = e.next) == null) {
                                    pred.next = new Node<K,V>(hash, key,
                                                              value, null);
                                    break;
                                }
                            }
                        }
                        else if (f instanceof TreeBin) {
                            Node<K,V> p;
                            binCount = 2;
                            if ((p = ((TreeBin<K,V>)f).putTreeVal(hash, key,
                                                           value)) != null) {
                                oldVal = p.val;
                                if (!onlyIfAbsent)
                                    p.val = value;
                            }
                        }
                    }
                }
                if (binCount != 0) {
                    if (binCount >= TREEIFY_THRESHOLD)
                        treeifyBin(tab, i);
                    if (oldVal != null)
                        return oldVal;
                    break;
                }
            }
        }
        addCount(1L, binCount);
        return null;
    }
通过以上代码及注释分析可以总结如下:
  1、 HashMap计算key的hash值时调用单独的方法,在该方法中会判断key是否为null,如果是则返回0;而Hashtable中则直接调用key的hashCode()方法,因此如果key为null,则抛出空指针异常。
  2、 HashMap将键值对添加进数组时,不会主动判断value是否为null;而Hashtable则首先判断value是否为null。
  3、以上原因主要是由于Hashtable继承自Dictionary,而HashMap继承自AbstractMap。
  4、虽然ConcurrentHashMap也继承自AbstractMap,但是其也过滤掉了key或value为null的键值对。
<think>嗯,用户问为什么Java中的HashMap允许键或值为null,而Hashtable不允许。我需要先回忆一下这两者的区别。首先,记得Hashtable是早期的Java集合类,而HashMap是后来加入的,属于Java集合框架的一部分。 然后,可能涉及到线程安全的问题。Hashtable是同步的,而HashMap不是。但用户的问题是关于null值的处理。为什么设计上会有这样的差异呢? 接下来想到,允许null值可能会带来一些使用上的便利,但同时也可能引发问题。比如,当调用get(key)返回null时,可能表示该键对应的值为null,或者该键不存在。不过HashMap提供了containsKey方法来解决这个歧义。 而Hashtable不允许null键或值,可能是因为设计上的选择,或者是线程安全导致的考虑。比如,在多线程环境下,如果允许null值,可能会增加并发处理的复杂性,比如需要额外的检查来避免NullPointerException。 另外,Hashtable的put方法如果接收到null键或值,会直接抛出NullPointerException。而HashMap则做了特殊处理,允许null键存放在第0个桶的位置,或者计算hash的时候有特殊处理。 可能需要查阅源码确认。比如,Hashtable的put方法中,会检查keyvalue是否为null,如果是的话就抛出异常。而HashMap的put方法中,对keynull的情况,会调用putForNullKey方法进行处理,将null键放在特定的位置。 还有,设计哲学的不同。HashMap旨在提供更灵活的使用,而Hashtable为了线程安全可能更严格。不过后来的ConcurrentHashMap也不允许null键值,这可能是因为并发情况下,存在null会导致难以判断是键不存在还是值为null,从而引发歧义。 总结起来,主要原因是线程安全和设计哲学的不同。Hashtable作为早期的同步实现,禁止null可能是为了避免潜在的并发问题,而HashMap作为非同步类,允许null提供了更多的灵活性,但需要开发者自行处理可能的歧义。</think>在Java中,`HashMap`允许键/值为`null`而`Hashtable`不允许,这主要由以下原因决定: --- ### 1. **设计目标的差异** - **`Hashtable`的历史背景** `Hashtable`是Java早期(JDK 1.0)引入的类,设计目标是**线程安全**。它的所有方法(如`put()`, `get()`)都通过`synchronized`关键字实现同步。 禁止`null`键/值的决定是为了避免在并发场景下出现歧义。例如,如果允许`null`值,调用`get(key)`返回`null`时,可能表示“键不存在”或“键对应的值就是`null`”,这在同步操作中难以区分且容易引发问题。 - **`HashMap`的设计哲学** `HashMap`是Java集合框架(JDK 1.2引入)的一部分,设计目标是**高效的非线程安全实现**。允许`null`键/值为开发者提供了更大的灵活性。 例如,可以用`null`键表示一种特殊状态(如默认配置),而`null`值可用于缓存未命中的结果。 --- ### 2. **技术实现的区别** - **`Hashtable`的严格限制** `Hashtable`的`put()`方法直接检查键/值是否为`null`,若为`null`则抛出`NullPointerException`。 ```java public synchronized V put(K key, V value) { if (value == null) throw new NullPointerException(); // ... } ``` - **`HashMap`的特殊处理** `HashMap`对`null`键做了特殊处理: - `null`键的哈希值固定为`0`,存储在哈希表的第一个桶(即索引为0的位置)。 - `null`值不需要特殊处理,直接其他值一样存储。 源码片段: ```java public V put(K key, V value) { if (key == null) return putForNullKey(value); // 处理null键 // ... } ``` --- ### 3. **并发场景的考量** - **`Hashtable`的线程安全`null`的冲突** 若`Hashtable`允许`null`值,在多线程环境下,当一个线程调用`containsKey(key)`检查键是否存在,而另一个线程同时修改哈希表时,可能导致状态不一致。 例如: - 线程A检查`containsKey("a")`返回`false`。 - 线程B插入`put("a", null)`。 - 线程A尝试获取`get("a")`,此时返回`null`,但无法确定是“键不存在”还是“值为`null`”。 - **`HashMap`的非线程安全假设** `HashMap`默认不保证线程安全,因此开发者需要自行处理`null`带来的潜在歧义(如通过`containsKey()`明确判断键是否存在)。 --- ### 4. **后续发展的影响** - **`ConcurrentHashMap`的延续** Java后续引入的并发容器`ConcurrentHashMap`(JDK 1.5)同样不允许`null`键/值,延续了`Hashtable`的设计思路,避免在并发场景下的歧义问题。 --- ### 总结对比表 | | **HashMap** | **Hashtable** | |----------------|-------------------|---------------------| | **线程安全** | 非线程安全 | 线程安全(同步方法) | | **允许null键** | ✔️ | ❌ | | **允许null值** | ✔️ | ❌ | | **设计目标** | 灵活性优先 | 安全性优先 | --- ### 实际开发建议 - **使用`HashMap`时**: 若需要区分“键不存在”和“值为`null`”,应显式调用`containsKey()`方法。 - **使用`Hashtable`时**: 若需存储`null`值,可用空对象(如`Optional.empty()`)替代,或改用`ConcurrentHashMap`。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值