文章目录
Java集合框架中的HashMap和Hashtable都是用于存储键值对的Map实现,但它们在设计理念、线程安全机制和性能特性上存在重要区别。本文将全面剖析这两种数据结构的异同,帮助开发者做出合理的技术选型。
一、核心区别总览
特性 | HashMap (JDK 1.2+) | Hashtable (JDK 1.0) |
---|---|---|
诞生版本 | Java 1.2 | Java 1.0 (遗留类) |
线程安全 | 非线程安全 | 线程安全(方法级同步) |
性能 | 更高 | 较低(同步开销) |
null支持 | 允许null键和null值 | 不允许null键或值 |
迭代器 | fail-fast | 不保证fail-fast |
继承体系 | 继承AbstractMap | 继承Dictionary |
初始容量 | 16 | 11 |
扩容机制 | 2倍增长 | 2倍+1增长 |
哈希算法 | 扰动函数优化分布 | 直接使用hashCode |
推荐使用 | 大多数场景首选 | 遗留系统维护 |
二、底层实现原理对比
1. HashMap的现代实现(JDK8+)
HashMap采用"数组+链表+红黑树"的混合结构:
// JDK8+的节点定义
static class Node<K,V> implements Map.Entry<K,V> {
final int hash;
final K key;
V value;
Node<K,V> next; // 链表指针
// 方法实现...
}
// 当链表长度≥8时转为树节点
static final class TreeNode<K,V> extends LinkedHashMap.Entry<K,V> {
TreeNode<K,V> parent;
TreeNode<K,V> left;
TreeNode<K,V> right;
TreeNode<K,V> prev; // 删除时需要
boolean red;
// 树操作方法...
}
存储结构示意图:
2. Hashtable的传统实现
Hashtable使用简单的"数组+链表"结构:
private transient Entry<?,?>[] table;
private static class Entry<K,V> implements Map.Entry<K,V> {
final int hash;
final K key;
V value;
Entry<K,V> next;
// 方法实现...
}
关键区别:
- HashMap使用树化优化长链表
- Hashtable始终保持链表结构
三、线程安全机制对比
1. Hashtable的粗粒度锁
// Hashtable的方法实现示例
public synchronized V put(K key, V value) {
// 实现代码...
}
public synchronized V get(Object key) {
// 实现代码...
}
- 所有方法使用
synchronized
修饰 - 同一时间只允许一个线程操作整个表
- 严重限制并发性能
2. HashMap的并发方案
方案1:Collections.synchronizedMap
Map<String, String> syncMap = Collections.synchronizedMap(new HashMap<>());
- 包装器模式,使用全局mutex锁
方案2:ConcurrentHashMap
ConcurrentHashMap<String, String> concurrentMap = new ConcurrentHashMap<>();
- 分段锁(JDK7)或CAS+synchronized(JDK8+)
- 更高并发度
并发性能对比:
barChart
title 并发吞吐量对比(ops/ms)
x-axis 实现方式
y-axis 吞吐量
bar Hashtable: 100
bar SynchronizedMap: 150
bar ConcurrentHashMap: 2000
四、null处理差异
1. HashMap的null处理
HashMap<String, String> map = new HashMap<>();
map.put(null, "value1"); // 允许
map.put("key1", null); // 允许
2. Hashtable的null限制
Hashtable<String, String> table = new Hashtable<>();
table.put(null, "value"); // 抛出NullPointerException
table.put("key", null); // 抛出NullPointerException
设计原因:
- Hashtable设计早期需要明确区分"key不存在"和"key值为null"
- HashMap通过containsKey()方法解决这个问题
五、迭代器行为对比
1. HashMap的fail-fast迭代器
HashMap<String, String> map = new HashMap<>(Map.of("a","1","b","2"));
Iterator<String> it = map.keySet().iterator();
while (it.hasNext()) {
System.out.println(it.next());
map.put("c", "3"); // 抛出ConcurrentModificationException
}
2. Hashtable的非fail-fast行为
- 规范不保证及时失败行为
- 可能静默接受并发修改
六、哈希算法优化
1. HashMap的扰动函数(JDK8)
static final int hash(Object key) {
int h;
return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}
- 高位参与运算,减少哈希冲突
2. Hashtable的简单哈希
int hash = key.hashCode();
int index = (hash & 0x7FFFFFFF) % table.length;
- 直接使用hashCode,分布性较差
七、扩容机制对比
1. HashMap扩容
final Node<K,V>[] resize() {
int newCap = oldCap << 1; // 2倍扩容
// ...其他处理逻辑
}
- 容量总是2的幂次方
- 扩容后元素位置:原位置或原位置+oldCap
2. Hashtable扩容
int newCapacity = (oldCapacity << 1) + 1; // 2倍+1
- 使用奇数的容量大小
- 需要重新计算所有元素位置
扩容性能影响:
八、现代开发实践建议
1. 完全替代方案
使用场景 | 推荐实现 | 优势 |
---|---|---|
单线程环境 | HashMap | 最佳性能 |
高并发读 | ConcurrentHashMap | 无锁读 |
全同步访问 | Collections.synchronizedMap | 简单包装 |
缓存实现 | Caffeine/Guava Cache | 专业缓存特性 |
2. 迁移示例
遗留代码改造:
// 改造前
Hashtable<String, User> userTable = new Hashtable<>();
// 改造后方案1(需要同步)
Map<String, User> userMap = Collections.synchronizedMap(new HashMap<>());
// 改造后方案2(高并发)
ConcurrentHashMap<String, User> userMap = new ConcurrentHashMap<>();
九、性能对比测试
public class MapPerformanceTest {
static final int SIZE = 1000000;
public static void main(String[] args) {
// 插入测试
testPut(new Hashtable<>(), "Hashtable");
testPut(Collections.synchronizedMap(new HashMap<>()), "SynchronizedHashMap");
testPut(new ConcurrentHashMap<>(), "ConcurrentHashMap");
testPut(new HashMap<>(), "HashMap(非线程安全)");
// 读取测试
Map<String, String> base = new HashMap<>();
for (int i = 0; i < SIZE; i++) base.put("key"+i, "value"+i);
testGet(new Hashtable<>(base), "Hashtable");
testGet(Collections.synchronizedMap(new HashMap<>(base)), "SynchronizedHashMap");
testGet(new ConcurrentHashMap<>(base), "ConcurrentHashMap");
}
static void testPut(Map<String, String> map, String name) {
long start = System.nanoTime();
for (int i = 0; i < SIZE; i++) {
map.put("key"+i, "value"+i);
}
System.out.printf("%s put耗时: %dms%n",
name, (System.nanoTime()-start)/1_000_000);
}
static void testGet(Map<String, String> map, String name) {
long start = System.nanoTime();
for (int i = 0; i < SIZE; i++) {
map.get("key"+i);
}
System.out.printf("%s get耗时: %dms%n",
name, (System.nanoTime()-start)/1_000_000);
}
}
典型测试结果:
Hashtable put耗时: 1200ms
SynchronizedHashMap put耗时: 800ms
ConcurrentHashMap put耗时: 400ms
HashMap(非线程安全) put耗时: 300ms
Hashtable get耗时: 600ms
SynchronizedHashMap get耗时: 500ms
ConcurrentHashMap get耗时: 200ms
十、历史演进与总结
- JDK 1.0:Hashtable作为原始键值存储
- JDK 1.2:引入HashMap和新的集合框架
- JDK 1.5:新增ConcurrentHashMap替代Hashtable
- JDK 8:HashMap引入树化优化
最终建议:
- 新代码永远不要使用Hashtable
- 单线程环境使用HashMap
- 并发环境使用ConcurrentHashMap
- 需要同步包装时用Collections.synchronizedMap
- 特殊需求考虑第三方实现(如Guava的ImmutableMap)