JDK 8 ArrayList 详解
Java 8 中的 ArrayList 是最常用的集合类之一,它基于动态数组实现,支持自动扩容。下面我将详细解析 ArrayList 的核心概念、实现原理和源码。
一、核心概念
1. 数据结构
- 动态数组:内部使用
Object[]存储元素,支持随机访问。
2. 关键参数
- 初始容量:10(默认),创建时分配的数组大小。
- 负载因子:隐式为1,当元素数量超过数组容量时触发扩容。
- 扩容机制:每次扩容为原容量的1.5倍(
oldCapacity + (oldCapacity >> 1))。
3. 特点
- 优点:随机访问快(O(1)),支持动态扩容。
- 缺点:插入/删除效率低(O(n)),需移动元素。
二、源码解析
1. 类定义与成员变量
public class ArrayList<E> extends AbstractList<E>
implements List<E>, RandomAccess, Cloneable, java.io.Serializable
{
// 序列化版本号
private static final long serialVersionUID = 8683452581122892189L;
// 默认初始容量
private static final int DEFAULT_CAPACITY = 10;
// 空数组实例(用于空实例)
private static final Object[] EMPTY_ELEMENTDATA = {};
// 默认容量的空数组实例(用于默认构造函数)
private static final Object[] DEFAULTCAPACITY_EMPTY_ELEMENTDATA = {};
// 存储ArrayList元素的数组缓冲区
transient Object[] elementData; // non-private to simplify nested class access
// ArrayList的大小(包含的元素个数)
private int size;
// 最大数组容量(某些VM会在数组中保留header words)
private static final int MAX_ARRAY_SIZE = Integer.MAX_VALUE - 8;
}
2. 构造函数
// 默认构造函数,初始化为空数组,首次添加元素时扩容为DEFAULT_CAPACITY
public ArrayList() {
this.elementData = DEFAULTCAPACITY_EMPTY_ELEMENTDATA;
}
// 指定初始容量的构造函数
public ArrayList(int initialCapacity) {
if (initialCapacity > 0) {
this.elementData = new Object[initialCapacity];
} else if (initialCapacity == 0) {
this.elementData = EMPTY_ELEMENTDATA;
} else {
throw new IllegalArgumentException("Illegal Capacity: "+
initialCapacity);
}
}
// 构造包含指定集合元素的列表
public ArrayList(Collection<? extends E> c) {
elementData = c.toArray();
if ((size = elementData.length) != 0) {
// c.toArray might (incorrectly) not return Object[] (see 6260652)
if (elementData.getClass() != Object[].class)
elementData = Arrays.copyOf(elementData, size, Object[].class);
} else {
// replace with empty array.
this.elementData = EMPTY_ELEMENTDATA;
}
}
3. add(E e) 方法
public boolean add(E e) {
ensureCapacityInternal(size + 1); // 确保容量足够
elementData[size++] = e; // 将元素添加到数组末尾
return true;
}
// 计算最小容量并确保内部容量足够
private void ensureCapacityInternal(int minCapacity) {
ensureExplicitCapacity(calculateCapacity(elementData, minCapacity));
}
// 计算所需的最小容量
private static int calculateCapacity(Object[] elementData, int minCapacity) {
if (elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA) {
return Math.max(DEFAULT_CAPACITY, minCapacity);
}
return minCapacity;
}
// 确保明确的容量
private void ensureExplicitCapacity(int minCapacity) {
modCount++; // 记录结构修改次数
// 如果最小容量大于当前数组长度,触发扩容
if (minCapacity - elementData.length > 0)
grow(minCapacity);
}
// 数组扩容方法
private void grow(int minCapacity) {
// 获取旧容量
int oldCapacity = elementData.length;
// 计算新容量(旧容量的1.5倍)
int newCapacity = oldCapacity + (oldCapacity >> 1);
// 如果新容量小于最小需求容量,直接使用最小需求容量
if (newCapacity - minCapacity < 0)
newCapacity = minCapacity;
// 如果新容量超过最大数组容量,处理溢出
if (newCapacity - MAX_ARRAY_SIZE > 0)
newCapacity = hugeCapacity(minCapacity);
// 调用Arrays.copyOf扩容数组
elementData = Arrays.copyOf(elementData, newCapacity);
}
// 处理大容量需求
private static int hugeCapacity(int minCapacity) {
if (minCapacity < 0) // overflow
throw new OutOfMemoryError();
return (minCapacity > MAX_ARRAY_SIZE) ?
Integer.MAX_VALUE :
MAX_ARRAY_SIZE;
}
4. add(int index, E element) 方法
public void add(int index, E element) {
// 检查索引是否合法
rangeCheckForAdd(index);
// 确保容量足够
ensureCapacityInternal(size + 1); // Increments modCount!!
// 将index及其之后的元素后移一位
System.arraycopy(elementData, index, elementData, index + 1,
size - index);
// 在index位置插入新元素
elementData[index] = element;
// 大小加1
size++;
}
// 检查添加操作的索引范围
private void rangeCheckForAdd(int index) {
if (index > size || index < 0)
throw new IndexOutOfBoundsException(outOfBoundsMsg(index));
}
5. get(int index) 方法
public E get(int index) {
// 检查索引是否合法
rangeCheck(index);
// 返回指定索引位置的元素
return elementData(index);
}
// 检查索引是否越界(仅检查是否>=size)
private void rangeCheck(int index) {
if (index >= size)
throw new IndexOutOfBoundsException(outOfBoundsMsg(index));
}
// 返回索引越界的错误信息
private String outOfBoundsMsg(int index) {
return "Index: "+index+", Size: "+size;
}
// 获取指定索引位置的元素(类型转换)
@SuppressWarnings("unchecked")
E elementData(int index) {
return (E) elementData[index];
}
6. remove(int index) 方法
public E remove(int index) {
// 检查索引是否合法
rangeCheck(index);
// 记录结构修改次数
modCount++;
// 获取要删除的元素
E oldValue = elementData(index);
// 计算需要移动的元素个数
int numMoved = size - index - 1;
if (numMoved > 0)
// 将index之后的元素前移一位
System.arraycopy(elementData, index+1, elementData, index,
numMoved);
// 将最后一个元素置为null,帮助GC
elementData[--size] = null; // clear to let GC do its work
// 返回被删除的元素
return oldValue;
}
7. 迭代器实现
public Iterator<E> iterator() {
return new Itr();
}
// 内部迭代器实现
private class Itr implements Iterator<E> {
int cursor; // 下一个要返回的元素的索引
int lastRet = -1; // 最后一个返回的元素的索引,-1表示没有
int expectedModCount = modCount; // 期望的修改次数,用于快速失败
// 判断是否还有下一个元素
public boolean hasNext() {
return cursor != size;
}
// 获取下一个元素
@SuppressWarnings("unchecked")
public E next() {
// 检查并发修改
checkForComodification();
int i = cursor;
if (i >= size)
throw new NoSuchElementException();
Object[] elementData = ArrayList.this.elementData;
if (i >= elementData.length)
throw new ConcurrentModificationException();
cursor = i + 1;
return (E) elementData[lastRet = i];
}
// 检查并发修改(快速失败机制)
final void checkForComodification() {
if (modCount != expectedModCount)
throw new ConcurrentModificationException();
}
// 其他方法...
}
三、关键特性分析
1. 扩容机制
- 触发条件:元素数量超过数组容量时。
- 扩容步骤:
- 计算新容量(原容量的1.5倍)。
- 检查是否超过最大容量(
Integer.MAX_VALUE - 8)。 - 使用
Arrays.copyOf创建新数组并复制元素。
2. 快速失败(Fail-Fast)机制
- 通过
modCount字段实现,记录结构修改次数。 - 迭代器初始化时记录
expectedModCount,每次操作前检查是否与modCount一致,不一致则抛出ConcurrentModificationException。
3. 序列化与反序列化
elementData被标记为transient,自定义序列化逻辑只保存实际存储的元素,而非整个数组。
四、线程安全性
ArrayList是非线程安全的,多线程环境下可能出现数据不一致问题。- 替代方案:
Vector:线程安全的动态数组,所有方法使用synchronized修饰,性能较低。Collections.synchronizedList:通过包装器实现同步。CopyOnWriteArrayList:写时复制的线程安全列表,适用于读多写少的场景。
五、使用建议
-
初始容量设置
- 预估元素数量,避免频繁扩容。例如,预计存储1000个元素,可通过
new ArrayList<>(1000)指定初始容量。
- 预估元素数量,避免频繁扩容。例如,预计存储1000个元素,可通过
-
避免中间插入/删除
ArrayList在中间插入或删除元素时需移动大量元素,效率低。如需频繁操作,建议使用LinkedList。
-
遍历方式选择
- 随机访问:使用
for(int i=0; i<size(); i++)效率最高。 - 迭代器遍历:使用
Iterator或foreach,支持删除操作。
- 随机访问:使用
六、总结
JDK 8 的 ArrayList 通过动态数组实现,支持自动扩容和随机访问,是最常用的集合类之一。理解其扩容机制、快速失败原理和性能特点,有助于在不同场景下高效使用。在多线程环境下,需使用线程安全的替代类。
1万+

被折叠的 条评论
为什么被折叠?



