Java集合框架详解-优快云博客

本文链接：https://blog.youkuaiyun.com/weixin_44203609/article/details/125580085

1. Java中有哪些集合

Java中的集合类主要由Collection和Map这两个接口派生出。

Collection接口又派生出三个子接口：Set、List、Queue

Set：HashSet、TreeSet

List：ArrayList、LinkedList、Vector

Queue：PriorityQueue、Deque

Map接口下的集合：

HashMap、ConcurrentHashMap、Hashtable、TreeMap

2. List、Set、Map三者的区别

List：存储的元素是有序的、可重复的。

Set：存储的元素是无序的、不可重复的。

Map：使用键值对存储。Key是无序的，不可重复的。value是无序的，可重复的。每个键最多映射到一个值。

3. ArrayList和LinkedList的区别

4. 有哪些线程安全的List

5. ArrayList和Vector的区别

ArrayList是不是线程安全的，Vector是线程安全的。

ArrayList中的方法不是同步的，Vector中的绝大多数方法都是直接或间接同步的。

6. ArrayList的扩容机制

1.ArrayList以无参构造方法创建ArrayList时，初始化赋值的是一个空数组，当真正对数组进行添加元素操作时，才真正分配容量。

当向ArrayList中添加第一个元素时，数组容量默认扩容为10。

2.当需要扩容时，ArrayList每次扩容都以原来容量的1.5倍进行扩容

3.然后再判断新容量是否大于最小需要容量，如果还是小于最小需要容量，那就把最小需要容量当作数组的新容量

4.如果新的容量已经大于最大容量MAX_ARRAY_SIZE（MAX_ARRAY_SIZE，MAX_ARRAY_SIZE为Integer.MAX_VALUE-8，-8是为了避免oom）,

则会调用hugeCapacity(）方法，返回Integer的最大值。

5.再通过Arrays.copyOf()方法将原数组中的内容放到扩容后的新数组里面。

7. HashMap底层实现

分JDK1.7和JDK1.8来答

在JDK1.7时，HashMap的底层数据结构是 数组+链表

在JDK1.8时，HashMap的底层数据结构是 数组+链表+红黑树

put操作：

①首先判断数组是否为空，如果数组为空则进行第一次扩容（resize）

②根据key计算hash值并与上数组的长度-1（int index = key.hashCode()&(length-1)）得到键值对在数组中的索引。

③如果该位置为null，则直接插入

④如果该位置不为null,则判断key是否一样(hashCode和equals)，如果一样则直接覆盖value

⑤如果key不一样，则判断该元素是否为红黑树的节点，如果是，则直接在红黑树中插入键值对

⑥如果不是红黑树的节点，则就是链表，遍历这个链表执行插入操作，如果遍历过程中若发现key已存在，直接覆盖value即可。

如果链表的长度大于等于8且数组中元素数量大于等于阈值64，则将链表转化为红黑树，（先在链表中插入再进行判断）

如果链表的长度大于等于8且数组中元素数量小于阈值64，则先对数组进行扩容，不转化为红黑树。

⑦插入成功后，判断数组中元素的个数是否大于阈值64（threshold），超过了就对数组进行扩容操作。

get操作：

①计算key的hashCode的值，找到key在数组中的位置

②如果该位置为null，就直接返回null

③否则，根据equals()判断key与当前位置的值是否相等，如果相等就直接返回。

④如果不等，再判断当前元素是否为树节点，如果是树节点就按红黑树进行查找。

⑤否则，按照链表的方式进行查找。

8. HashMap的扩容机制

HashMap的长度为什么是2的幂次方
HashMap长度为2的幂次方的原因是为了减少Hash碰撞，尽量使Hash算法的结果均匀。
我觉得最重要的一点: 是因为2的n次幂减1 其二进制位都是1，能够最大程度避免碰撞。
1、HashMap的长度是2的次幂的话，可以让数据更散列更均匀的分布，更充分的利用数组的空间
2、HashMap的长度一定是2的次幂，还有另外一个原因，那就是在扩容迁移的时候不需要再重新通过哈希
定位新的位置了。扩容后，元素新的位置，要么在原脚标位，要么在原脚标位+扩容长度这么一个位置

9.HashMap为什么是线程不安全的

分JDK1.7和JDK1.8来答

1.在JDK1.7中，当并发执行扩容操作时会造成死循环和数据丢失的情况。

在JDK1.7中，在多线程情况下同时对数组进行扩容，需要将原来数据转移到新数组中，在转移元素的过程中使用的是头插法，会造成死循环。

2.在JDK1.8中，在并发执行put操作时会发生数据覆盖的情况。

如果线程A和线程B同时进行put操作，刚好这两条不同的数据hash值一样，并且该位置数据为null，所以这线程A、B都会通过判断，将执行插入操作。

假设一种情况，线程A进入后还未进行数据插入时挂起，而线程B正常执行，从而正常插入数据，然后线程A获取CPU时间片，此时线程A不用再进行hash判断了，问题出现：线程A会把线程B插入的数据给覆盖，发生线程不安全。

10. HashMap是如何解决哈希冲突的

拉链法（链地址法）

为了解决碰撞，数组中的元素是单向链表类型。当链表长度大于等于8时，会将链表转换成红黑树提高性能。

而当链表长度小于等于6时，又会将红黑树转换回单向链表提高性能。

11. HashMap为什么使用红黑树而不是B树或平衡二叉树AVL或二叉查找树

1.不使用二叉查找树

二叉排序树在极端情况下会出现线性结构。例如：二叉排序树左子树所有节点的值均小于根节点，如果我们添加的元素都比根节点小，会导致左子树线性增长，这样就失去了用树型结构替换链表的初衷，导致查询时间增长。所以这是不用二叉查找树的原因。

2.不使用平衡二叉树

平衡二叉树是严格的平衡树，红黑树是不严格平衡的树，平衡二叉树在插入或删除后维持平衡的开销要大于红黑树。

红黑树的虽然查询性能略低于平衡二叉树，但在插入和删除上性能要优于平衡二叉树。

选择红黑树是从功能、性能和开销上综合选择的结果。

3.不使用B树/B+树

HashMap本来是数组+链表的形式，链表由于其查找慢的特点，所以需要被查找效率更高的树结构来替换。

如果用B/B+树的话，在数据量不是很多的情况下，数据都会“挤在”一个结点里面，这个时候遍历效率就退化成了链表。

红黑树

每个节点是红色或者黑色；
根节点是黑色；
所有叶子节点都是黑色（叶子是NIL节点，也称为外节点）;
每个红色节点的子节点都是黑色（从每个叶子节点到根节点的所有路径上不能有两个连续的红色节点）；
从红黑树的任一节点到其每个叶子节点的所有路径都包含相同数目的黑色节点（包含黑色节点的数目称为该节点的黑高度）。

12.HashMap和Hashtable的区别

①HashMap是⾮线程安全的，Hashtable是线程安全的。

Hashtable 内部的⽅法基本都经过 synchronized 修饰。

②因为线程安全的问题，HashMap要⽐Hashtable效率⾼⼀点。

③HashMap允许键和值是null，而Hashtable不允许键或值是null。

HashMap中，null 可以作为键，这样的键只有⼀个，可以有⼀个或多个键所对应的值为 null。

HashTable 中 put 进的键值只要有⼀个 null，直接抛出 NullPointerException。

④ Hashtable默认的初始⼤⼩为11，之后每次扩充，容量变为原来的2n+1。

HashMap默认的初始⼤⼩为16，之后每次扩充，容量变为原来的2倍。

⑤创建时如果给定了容量初始值，那么 Hashtable 会直接使⽤你给定的⼤⼩，⽽ HashMap 会将其扩充为2的幂次⽅⼤⼩。

⑥JDK1.8 以后的 HashMap 在解决哈希冲突时当链表⻓度⼤于等于8时，将链表转化为红⿊树，以减少搜索时间。Hashtable没有这样的机制。

Hashtable的底层，是以数组+链表的形式来存储。

⑦HashMap的父类是AbstractMap，Hashtable的父类是Dictionary

13. ConcurrentHashMap底层实现

在JDK8中，ConcurrentHashMap的底层数据结构与HashMap一样，也是采用“数组+链表+红黑树”的形式。同时，它又采用锁定头节点的方式降低了锁粒度，以较低的性能代价实现了线程安全。底层数据结构的逻辑可以参考HashMap的实现，下面我重点介绍它的线程安全的实现机制。

初始化数组或头节点时，ConcurrentHashMap并没有加锁，而是CAS的方式进行原子替换（原子操作，基于Unsafe类的原子操作API）。
插入数据时会进行加锁处理，但锁定的不是整个数组，而是槽中的头节点。所以，ConcurrentHashMap中锁的粒度是槽，而不是整个数组，并发的性能很好。
扩容时会进行加锁处理，锁定的仍然是头节点。并且，支持多个线程同时对数组扩容，提高并发能力。每个线程需先以CAS操作抢任务，争抢一段连续槽位的数据转移权。抢到任务后，该线程会锁定槽内的头节点，然后将链表或树中的数据迁移到新的数组里。
查找数据时并不会加锁，所以性能很好。另外，在扩容的过程中，依然可以支持查找操作。如果某个槽还未进行迁移，则直接可以从旧数组里找到数据。如果某个槽已经迁移完毕，但是整个扩容还没结束，则扩容线程会创建一个转发节点存入旧数组，届时查找线程根据转发节点的提示，从新数组中找到目标数据。
加分回答
ConcurrentHashMap实现线程安全的难点在于多线程并发扩容，即当一个线程在插入数据时，若发现数组正在扩容，那么它就会立即参与扩容操作，完成扩容后再插入数据到新数组。在扩容的时候，多个线程共同分担数据迁移任务，每个线程负责的迁移数量是 (数组长度 >>> 3) / CPU核心数。
也就是说，为线程分配的迁移任务，是充分考虑了硬件的处理能力的。多个线程依据硬件的处理能力，平均分摊一部分槽的迁移工作。另外，如果计算出来的迁移数量小于16，则强制将其改为16，这是考虑到目前服务器领域主流的CPU运行速度，每次处理的任务过少，对于CPU的算力也是一种浪费。
JDK1.7

底层数据结构：Segments数组+HashEntry数组+链表，采用分段锁保证安全性

一个ConcurrentHashMap中有一个Segments数组，一个Segments中存储一个HashEntry数组，每个HashEntry是一个链表结构的元素。

segment继承自ReentrantLock锁。

首先将数据分为一段一段的存储，然后给每一段数据配一把锁，当一个线程占用锁访问其中一段数据时，其他段的数据也能被其他线程访问，实现了真正的并发访问。

get()操作：

HashEntry中的value属性和next指针是用volatile修饰的，保证了可见性，所以每次获取的都是最新值，get过程不需要加锁。

1.将key传入get方法中，先根据key的hashcode的值找到对应的segment段。

2.再根据segment中的get方法再次hash，找到HashEntry数组中的位置。

3.最后在链表中根据hash值和equals方法进行查找。

ConcurrentHashMap的get操作跟HashMap类似，只是ConcurrentHashMap第一次需要经过一次hash定位到Segment的位置，然后再hash定位到指定的HashEntry，遍历该HashEntry下的链表进行对比，成功就返回，不成功就返回null

put()操作：

1.将key传入put方法中，先根据key的hashcode的值找到对应的segment段