HashMap是如何实现的?
HashMap由数组+链表组成的,数组是HashMap的主体,链表则是主要为了解决哈希冲突而存在的,如果定位到的数组位置不含链表(当前entry的next指向null),那么对于查找,添加等操作很快,仅需一次寻址即可;如果定位到的数组包含链表,对于添加操作,其时间复杂度依然为O(1),因为最新的Entry会插入链表头部,只需要简单改变引用链即可,而对于查找操作来讲,在定位到数组相应的结点之后,还需要遍历链表,然后通过key对象的equals方法逐一比对查找。所以,性能考虑,HashMap中的链表出现越少,性能才会越好。
HashMap是线程安全的吗?
HashMap是线程不安全的。
在多线程环境下,使用HashMap进行put操作会导致HashMap的Entry链表形成环形数据结构,一旦形成环形数据结构,Entry的next节点永远不为空,就会产生死循环,导致CPU利用率接近100%,所以在并发情况下不能使用HashMap。
那有什么线程安全的结构呢?
HashTable
HashTable是使用synchronized来保证线程的安全。当一个线程访问HashTable的同步方法,其他方法访问HashTable的同步方法时,会进入阻塞或者轮询状态。如果线程A使用put进行元素添加,线程B不但不能用put方法添加于元素同是也无法用get方法来获取元素,所以竞争越激烈效率越低,因此它被淘汰了。
ConcurrentHashMap
HashTable容器在竞争激烈的并发环境效率低下的原因是所有访问HashTable的线程都必须竞争同一把锁。那假如容器有多把锁,每一把锁用于锁住容器中一部分数据,那么多线程访问容器里不同数据段的数据时,线程间就不会存在锁竞争,从而可以有效提高并发访问率,这就是ConcurrentHashMap的锁分段技术。将数据分成一段一段的存储,然后给每一段数据配一把锁,当一个线程占用锁访问其中一段数据的时候,其他段的数据也能被其他线程访问。
ConcurrentHashMap插入、查询逻辑
- put:
1.定位segment并确保定位的Segment已初始化
2.调用Segment的put方法。 - Get:
先定位Segment,再定位HashEntry