前言
- HashMap: 在多线程环境下,使用
HashMap
进行put
操作可能会引起死循环,导致CPU利用率接近100%,所以在并发情况下不能使用HashMap
。 - HashTable:
Hashtable
和HashMap
的实现原理几乎一样,只是Hashtable
不允许key
和value
为null
,而hashmap
允许为null
。但Hashtable
是线程安全的,不过Hashtable
线程安全的策略实现代价却太大了,get/put
所有相关操作都是synchronized
的,这相当于给整个哈希表加了一把大锁。所以多线程访问时候,只要有一个线程访问或操作该对象,那其他线程只能阻塞,相当于将所有的操作串行化,在竞争激烈的并发场景中性能就会非常差。 - ConcurrentHashMap: 主要为应对
hashMap
在并发环境下不安全而诞生,它大量的利用了volatile
,final
,CAS
等lock-free
技术来减少锁竞争对于性能的影响。将全局加锁改成了局部加锁,极大地提高了并发环境下的操作速度。
JDK1.7
- 在JDK1.7中
ConcurrentHashMap
采用了数组+Segment+分段锁的方式实现。 ConcurrentHashMap
中的分段锁称为Segment
,是为了减少锁的粒度,它类似于HashMap
的结构,即内部拥有一个Entry
数组,数组中的每个元素又是一个链表,同时又是一个ReentrantLock
(Segment
继承了ReentrantLock
)。
ConcurrentHashMap
使用分段锁技术,将数据分成一段一段的存储,然后给每一段数据配一把锁,当一个线程占用锁访问其中一个段数据的时候,其他段的数据也能被其他线程访问,能够实现真正的并发访问。ConcurrentHashMap
定位一个元素的过程需要进行两次Hash操作。第一次Hash
定位到Segment
,第二次Hash
定位到元素所在的链表的头部。- 优劣
-
坏处: 这种结构的带来的副作用是
Hash
的过程要比普通的HashMap
长。 -
好处: 写操作的时候可以只对元素所在的
Segment
进行加锁即可,不会影响到其他的Segment
,这样,在最理想的情况下,ConcurrentHashMap
可以最高同时支持Segment
数量大小的写操作(刚好这些写操作都非常平均地分布在所有的Segment上),所以,通过这一种结构,ConcurrentHashMap
的并发能力可以大大的提高。
JDK1.8
- JDK1.8中
ConcurrentHashMap
参考了HashMap
的实现,采用了数组+链表+红黑树 的实现方式,内部大量采用CAS操作
。在1.8中彻底放弃了Segment
转而采用的是Node
,其设计思想也不再是JDK1.7中的分段锁思想。 - 可以看出
JDK1.8
版本的ConcurrentHashMap
的数据结构已经接近HashMap
,ConcurrentHashMap
只是增加了同步的操作来控制并发
Node:
保存key,value及key的hash值的数据结构。其中value和next都用volatile修饰,保证并发的可见性。
ConcurrentHashMap
结构基本上和HashMap
一样,不过它可以保证线程安全性。
由于引入了红黑树,使得ConcurrentHashMap的实现非常复杂,JDK8中ConcurrentHashMap在链表的长度大于某个阈值的时候会将链表转换成红黑树进一步提高其查找性能。
知识点补充
-
CAS是(
compare and swap
),即比较交换。cas是一种基于锁的操作,而且是乐观锁。在java中锁分为乐观锁和悲观锁。悲观锁是将资源锁住,等一个之前获得锁的线程释放锁之后,下一个线程才可以访问。而乐观锁采取了一种宽泛的态度,通过某种方式不加锁来处理资源,比如通过给记录加version来获取数据,性能较悲观锁有很大的提高。 -
CAS 操作包含三个操作数 —— 内存位置(V)、预期原值(A)和新值(B)。如果内存地址里面的值和A的值是一样的,那么就将内存里面的值更新成B。CAS是通过无限循环来获取数据的,如果在第一轮循环中,a线程获取地址里面的值被b线程修改了,那么a线程需要自旋,到下次循环才有可能机会执行。
-
红黑树是一种性能非常好的二叉查找树,其查找性能为
O(logN)
,但是其实现过程较为复杂,而且可读性也非常差,早期完全采用链表结构时Map的查找时间复杂度为O(N)
。
归纳总结
- 从JDK1.7版本的
ReentrantLock+Segment+HashEntry
- 到JDK1.8版本中
synchronized+CAS+HashEntry+红黑树
- 数据结构:取消了
Segment
分段锁的数据结构,取而代之的是数组+链表+红黑树的结构。 - 保证线程安全机制:JDK1.7采用segment的分段锁机制实现线程安全,其中segment继承自ReentrantLock。JDK1.8则采用
CAS+Synchronized
保证线程安全。 - 锁的粒度:原来是对需要进行数据操作的
Segment
加锁,现调整为对每个数组元素加锁(Node)
。 - 链表转化为红黑树:定位结点的hash算法简化会带来弊端,Hash冲突加剧,因此在链表节点数量大于8时,会将链表转化为红黑树进行存储。
- 查询时间复杂度:从原来的遍历链表
O(n)
,变成遍历红黑树O(logN)
。