ConcurrentHashMap源码解析

最新推荐文章于 2024-05-21 23:02:43 发布

T__LONG

最新推荐文章于 2024-05-21 23:02:43 发布

阅读量199

点赞数

分类专栏： java api源码

本文链接：https://blog.youkuaiyun.com/qq_36277052/article/details/82889281

版权

java api源码专栏收录该内容

2 篇文章

订阅专栏

本文详细剖析了JDK1.8中ConcurrentHashMap的核心方法，包括其线程安全的实现原理，与HashMap的区别，以及与JDK1.8之前版本的不同。通过源码分析，解释了put和get方法的工作流程，初始化和链表转红黑树的过程。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

在上篇文章中我们讲解了HashMap的核心源码部分，但我们知道在并发环境下，HashMap会出现线程安全问题，HashMap的扩容操作会出现闭环现象，当调用get方法时，会出现死循环。所以，JDK给我们提供了另一个线程安全容器，ConcurrentHashMap。

在本章中我们来详细探讨JDK 1.8中ConcurrentHashMap的核心方法，且为什么是线程安全的以及和JDK 1.8之前的又有何区别。

ConcurrentHashMap底层容器和HashMap相同，同样是Node数组+链表+红黑树，不同的是在原来的基础之上使用了Synchronized+CAS来保证线程安全，下面我们来进行源码分析。

put

public V put(K key, V value) {
		return putVal(key, value, false);
	}

	final V putVal(K key, V value, boolean onlyIfAbsent) {
		//从这我们可以看出ConcurrentHashMap的key和value不能为null
		if (key == null || value == null) throw new NullPointerException();
		//得到key的hash值
		int hash = spread(key.hashCode());
		//这是用来记录链表的长度
		int binCount = 0;
		//table：核心的Node数组。
		for (Node<K,V>[] tab = table;;) {
			Node<K,V> f; int n, i, fh;
			//如果数组为空，则进行数组的初始化。这里相当于懒汉模式，使用的时候才去初始化
			if (tab == null || (n = tab.length) == 0)
				//进行数组的初始化
				tab = initTable();
			//根据key的hash计算出该key在Node数组中的位置，并判断这个位置是否为null
			else if ((f = tabAt(tab, i = (n - 1) & hash)) == null) {
				//当前的数组位置为null，则使用CAS插入一个新的Node
				if (casTabAt(tab, i, null,
						new Node<K,V>(hash, key, value, null)))
					break;                   // no lock when adding to empty bin
			}
			//表示正在进行扩容操作 涉及了ForwardingNode 这个特殊的Node，
                        //在扩容时会进行创建，且固定传入的hash值为 -1
			else if ((fh = f.hash) == MOVED)
				tab = helpTransfer(tab, f);
			//到了这里表示，出现了hash冲突，key在Node数组中的索引位置不为null。
			//需进行链表或红黑树的插入操作。
			else {
				V oldVal = null;
				//这个 f 存放是 根据key在数组中找到的Node，相当于红黑树或链表的头结点，并进行加锁
				synchronized (f) {
					//这里再进行一次判断，保证f没被其它线程修改
					if (tabAt(tab, i) == f) {
						//如果是链表
						if (fh >= 0) {
							//统计链表的长度
							binCount = 1;
							//对f这个Node进行累加链表的长度，并遍历链表
							for (Node<K,V> e = f;; ++binCount) {
								K ek;
								//如果存在相同的value，则覆盖
								if (e.hash == hash &&
										((ek = e.key) == key ||
												(ek != null && key.equals(ek)))) {
									oldVal = e.val;
									if (!onlyIfAbsent)
										e.val = value;
									break;
								}
								Node<K,V> pred = e;
								//遍历到最后一个Node，插入一个新的Node到链表的尾部
								if ((e = e.next) == null) {
									pred.next = new Node<K,V>(hash, key,
											value, null);
									break;
								}
							}
						}
						//如果是红黑树
						else if (f instanceof TreeBin) {
							Node<K,V> p;
							binCount = 2;
							//使用红黑树的方式进行Node的插入
							if ((p = ((TreeBin<K,V>)f).putTreeVal(hash, key,
									value)) != null) {
								oldVal = p.val;
								if (!onlyIfAbsent)
									p.val = value;
							}
						}
					}
				}
				if (binCount != 0) {
					//判断链表的长度是否大于TREEIFY_THRESHOLD，是则转红黑树
					if (binCount >= TREEIFY_THRESHOLD)
						treeifyBin(tab, i);
					if (oldVal != null)
						return oldVal;
					break;
				}
			}
		}
		//统计整个的数组长度，并判断是否需要扩容
		addCount(1L, binCount);
		return null;
	}

好了，以上就是大致的分析内容，但还有许多步骤没有展开代码详细说明，如初始化、链表转红黑树及扩容等，其中扩容步骤非常复杂，有机会我会单独写一篇博客详细介绍，在这就不多说了。我们接下来介绍较为简单的初始化及get方法。

初始化数组

private final Node<K,V>[] initTable() {
		Node<K,V>[] tab; int sc;
		while ((tab = table) == null || tab.length == 0) {
			//表示已经有线程在进行初始化操作，让出CPU的执行权
			if ((sc = sizeCtl) < 0)
				Thread.yield(); // lost initialization race; just spin
			//把sc赋值为 -1，表示当前线程开始执行初始化操作
			else if (U.compareAndSwapInt(this, SIZECTL, sc, -1)) {
				try {
					if ((tab = table) == null || tab.length == 0) {
						//获取数组的初始长度，默认为16
						int n = (sc > 0) ? sc : DEFAULT_CAPACITY;
						@SuppressWarnings("unchecked")
						//初始化数组
						Node<K,V>[] nt = (Node<K,V>[])new Node<?,?>[n];
						table = tab = nt;
						sc = n - (n >>> 2);
					}
				} finally {
					//sizeCtl 参数 第一个if判断需要用到
					sizeCtl = sc;
				}
				break;
			}
		}
		return tab;
	}

get

public V get(Object key) {
		Node<K,V>[] tab; Node<K,V> e, p; int n, eh; K ek;
		//计算key的hash
		int h = spread(key.hashCode());
		if ((tab = table) != null && (n = tab.length) > 0 &&
				//根据hash值做运算获取数组对应的Node（相当于头结点）
				(e = tabAt(tab, (n - 1) & h)) != null) {
			//根据hash和equals判断该Node的key是否和get的key相等,是则返回value
			if ((eh = e.hash) == h) {
				if ((ek = e.key) == key || (ek != null && key.equals(ek)))
					return e.val;
			}
			//这里判断是否正在扩容 或者 该节点为红黑树
			else if (eh < 0)
				return (p = e.find(h, key)) != null ? p.val : null;
			//到了这一步表示该结构为链表，遍历链表，返回value
			while ((e = e.next) != null) {
				if (e.hash == h &&
						((ek = e.key) == key || (ek != null && key.equals(ek))))
					return e.val;
			}
		}
		return null;
	}

好了，核心的源码部分就分析到这里，我们在来看看JDK 1.8之前的ConcurrentHashMap大致是怎么实现的，区别相当大。

1.8之前的ConcurrentHashMap是采用了ReentrantLock+Segment+HashEntry的结构，如下：

我们可以看到整体就是由一个个 Segment 组成，Segment中包含了HashEntry数组，HashEntry数组就是1.8的那个table，只不过它这里是多个。其中Segment在实现上继承了ReentrantLock，这样就自带了锁的功能，它在进行put的时候只会锁住一个Segment，所以理论上，最多可以同时支持 Segment 个数的线程并发写，只要它们的操作分别分布在不同的 Segment 上。get的时候也是先找到一个Segment，然后在根据Hash值找到数组中的值。

至于为什么JDK在之后使用Synchronized来保证线程安全，是因为在JDK在版本迭代中一直在对Synchronized进行优化，使得Synchronized关键字在某些场景下已经不比ReentrantLock效率慢，甚至更快。

好了，以上就是本次的内容，如有错误请及时指出，本人感激不尽！

参考：

https://www.jianshu.com/p/e694f1e868ec