ArrayList源码分析解读

最新推荐文章于 2025-05-15 21:42:20 发布

MRZvc

最新推荐文章于 2025-05-15 21:42:20 发布

阅读量125

点赞数

文章标签：数据结构

本文链接：https://blog.youkuaiyun.com/u011139089/article/details/99440211

版权

Java集合框架专栏收录该内容

12 篇文章

订阅专栏

本文全面解析了Java ArrayList的内部结构、工作原理及关键方法。包括ArrayList的实例变量、构造方法、核心方法如add、remove、get等的实现细节，以及特有的trimToSize和ensureCapacity方法。同时，探讨了ArrayList的序列化过程和RandomAccess特性。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

概述

ArrayList是Java一个很常用的集合类，它相当于一个动态数组，内部的数组大小可以根据元素实际情况自动分配，也可以自己分配大小。
在使用ArrayList的时候，应注意ArrayList并不是线程安全的，如果需要多线程并发操作应当使用CopyOnWriteArrayList(读远大于写的情况)，或者使用Collections工具类的synchronizedList方法将其包装。

下面是ArrayList UML类图
è¿éåå¾çæè¿°

ArrayList继承了AbstractList抽象类，实现了RandomAccess、Serializable、Cloneable接口，说明ArrayList支持快速随机访问、支持克隆和序列化操作。

源码解析

1、实例变量

/**
 * 默认初始容量（数组大小），可通过构造器置顶容量大小
 */
private static final int DEFAULT_CAPACITY = 10;

/**
 * 用于空实例的共享空数组实例
 */
private static final Object[] EMPTY_ELEMENTDATA = {};

/**
 * 共享空数组实例，用于默认大小的空实例。我们将其与EMPTY_ELEMENTDATA
 * 区分开来，以了解添加第一个元素时应该膨胀多少。
 */
private static final Object[] DEFAULTCAPACITY_EMPTY_ELEMENTDATA = {};

/**
 * 存储ArrayList元素的数组缓冲区。
 * ArrayList的容量是这个数组缓冲区的长度。任何
 * 使用elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA清空ArrayList
 * 将在添加第一个元素时扩展为DEFAULT_CAPACITY。
 */
transient Object[] elementData; // non-private to simplify nested class access

/**
 * ArrayList的大小(它包含的元素的数量)。
 * @serial
 */
private int size;

/**
 * 记录被修改的次数
 */
protected transient int modCount = 0;

elementData负责保存该集合持有的元素，size保存该集合的持有的元素个数（不一定等于elementData.length）

2、构造方法

ArrayList提供了三个public构造方法：

public ArrayList() {
    this.elementData = DEFAULTCAPACITY_EMPTY_ELEMENTDATA;
}

这个构造方法默认将elementData初始化为一个空数组，当调用了add方法时，会默认分配一个长度为10的数组给elementData。

public ArrayList(int initialCapacity) {
	if (initialCapacity > 0) {
		this.elementData = new Object[initialCapacity];
	} else if (initialCapacity == 0) {
		this.elementData = EMPTY_ELEMENTDATA;
	} else {
		throw new IllegalArgumentException("Illegal Capacity: "+
										   initialCapacity);
	}
}

该构造方法可以传入一个int参数，代表初始分配的数组大小，如果传入的参数小于0会抛出IllegalArgumentException异常。

public ArrayList(Collection<? extends E> c) {
	elementData = c.toArray();
	if ((size = elementData.length) != 0) {
		// c.toArray might (incorrectly) not return Object[] (see 6260652)
		if (elementData.getClass() != Object[].class)
			elementData = Arrays.copyOf(elementData, size, Object[].class);
	} else {
		// replace with empty array.
		this.elementData = EMPTY_ELEMENTDATA;
	}
}

可以传入一个Collection集合，该构造方法会将这个集合里的所有元素作为ArrayList的初始元素。
首先该方法会调用toArray方法（<T> T[] toArray()）获得该集合所有元素的引用副本，如果该集合不为空且数组类型不为Object[]，则将这些元素的引用复制到elementData数组。

3、方法解析

（1）size、isEmpty方法

该方法直接返回成员变量size

public int size() {
    return size;
}

其实现和父类AbstractList相同
同样isEmpty方法也是，直接判断size是不是为0

（2）add方法

add方法的作用是向集合添加元素，ArrayList中有两个重载的方法：
public boolean add(E e);和public void add(int index, E element);
add(E e)方法详解

public boolean add(E e) {
    ensureCapacityInternal(size + 1);
    elementData[size++] = e;
	return true;
}

private void ensureCapacityInternal(int minCapacity) {
    if (elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA) {
		minCapacity = Math.max(DEFAULT_CAPACITY, minCapacity);
    }
	ensureExplicitCapacity(minCapacity);
}

private void ensureExplicitCapacity(int minCapacity) {
    modCount++;
	if (minCapacity - elementData.length > 0)
        grow(minCapacity);
}

private void grow(int minCapacity) {
	int oldCapacity = elementData.length;
	//相当于oldCapacity的1.5倍
    int newCapacity = oldCapacity + (oldCapacity >> 1);
    if (newCapacity - minCapacity < 0)
        newCapacity = minCapacity;
    if (newCapacity - MAX_ARRAY_SIZE > 0)
        newCapacity = hugeCapacity(minCapacity);
    elementData = Arrays.copyOf(elementData, newCapacity);
}

private static int hugeCapacity(int minCapacity) {
	//小于0代表minCapacity溢出
	if (minCapacity < 0)
        throw new OutOfMemoryError();
    return (minCapacity > MAX_ARRAY_SIZE) ? Integer.MAX_VALUE : MAX_ARRAY_SIZE;
}

在调用add方法真正添加元素之前，会首先检测elementData数组的长度是否足够，具体的执行逻辑是：
首先调用ensureCapacityInternal方法，如果elementData指向了DEFAULTCAPACITY_EMPTY_ELEMENTDATA，即空数组（通过无参构造器构造ArrayList，或指定初始化大小为0构造，或指定的初始化集合没有元素时构造，elementData会指向该元素），那么会默认给elementData分配一个长度为10的数组。接着调用ensureExplicitCapacity方法，该方法首先增加计数器modCount，接着判断数组空间大小是否足够（即添加元素后数组会不会越界），如果不够，则调用grow方法。grow方法的作用时给elementData分配一个新的数组并将旧的数组拷贝到这个新数组中，默认分配大小为原数组的1.5倍。如果分配的数组过大（超过Integer.MAX_VALUE - 8，一般都不会那么大），则调用hugeCapacity静态方法，如果minCapacity介于Integer.MAX_VALUE - 8到Integer.MAX_VALUE，则直接分配一个Integer.MAX_VALUE大小的数组，否则抛出OutOfMemoryError。

void add(int index, E element)
index为插入元素的位置

public void add(int index, E element) {
	rangeCheckForAdd(index);
    ensureCapacityInternal(size + 1);
    System.arraycopy(elementData, index, elementData, index + 1, size - index);
    elementData[index] = element;
    size++;
}
private void rangeCheckForAdd(int index) {
	if (index > size || index < 0)
        throw new IndexOutOfBoundsException(outOfBoundsMsg(index));
}
private String outOfBoundsMsg(int index) {
	return "Index: " + index + ", Size: " + size;
}

该方法首先会检查数组下标，如果index越界则抛出IndexOutOfBoundsException异常。接着按add(E e)方法一样检查数组长度是否足够。然后将数组从index开始右移一个位置，再将目标元素插入到elementData[index]中。

（3）remove方法

remove有两个重载的方法：E remove(int)和boolean remove(Object o)
E remove(int)
该方法需要传入一个int参数，代表需要移除的数组元素下标，返回的是删除的元素

public E remove(int index) {
	rangeCheck(index);
    modCount++;
    E oldValue = elementData(index);

    int numMoved = size - index - 1;
    if (numMoved > 0)
		System.arraycopy(elementData, index+1, elementData, index, numMoved);
    elementData[--size] = null;

    return oldValue;
}
@SuppressWarnings("unchecked")
E elementData(int index) {
	return (E) elementData[index];
}

同样，首先检查数组下标是否越界。然后调用System.arraycopy将需要删除的元素后面所有的数组元素往前移一个位置，最后显式调用elementData[--size] = null;来通知GC：空间不足时可以将此对象进行回收。

boolean remove(Object)
该方法传入一个Object对象，来删除集合中调用equals方法返回true的对象。如果有任意一个元素满足条件被删除则直接返回true。

public boolean remove(Object o) {
	if (o == null) {
        for (int index = 0; index < size; index++)
            if (elementData[index] == null) {
                fastRemove(index);
                return true;
            }
        } else {
		for (int index = 0; index < size; index++)
			if (o.equals(elementData[index])) {
				fastRemove(index);
                return true;
		}
    }
	return false;
}

private void fastRemove(int index) {
    modCount++;
    int numMoved = size - index - 1;
    if (numMoved > 0)
	    System.arraycopy(elementData, index + 1, elementData, index, numMoved);
	elementData[--size] = null;
}

该方法首先判断传入的Object是不是为null，如果为null，则从数组下标0开始搜索第一个为null的元素，找到后调用私有方法fastRemove（和上面remove方法同样的策略）移动数组并删除，然后返回true。如果不为null，则同样遍历数组，删除第一个equals方法返回true对象，返回true。如果没有找到符合条件的对象，返回false。

（4）get、set方法

E get(int)
get方法需要传入一个int参数，代表下标号

public E get(int index) {
	rangeCheck(index);
    return elementData(index);
}

get方法首先检查参数index是否越界，否则抛出异常。然后调用elementData方法直接返回元素。

E set(int, E)
set方法需要传入两个参数，添加的元素和位置

public E set(int index, E element) {
    rangeCheck(index);
    E oldValue = elementData(index);
	elementData[index] = element;
	return oldValue;
}

这个方法不像add方法那样会移出一个位置插入元素，set方法会直接在数组的index位置放入元素，如果之前这个位置已经存在一个元素则会被替换，最后返回那个被替换掉的元素。

（5）contains、indexOf、lastIndexOf方法

int indexOf(Object)
该方法返回第一个和Object相等的元素所在的数组下标，如果不存在返回-1

public int indexOf(Object o) {
	if (o == null) {
		for (int i = 0; i < size; i++)
            if (elementData[i]==null)
                return i;
    } else {
        for (int i = 0; i < size; i++)
            if (o.equals(elementData[i]))
                return i;
    }
    return -1;
}

boolean contains(Object o)
该方法判断数组中是否存在相同的元素

public boolean contains(Object o) {
	return indexOf(o) >= 0;
}

int lastIndexOf(Object)
该方法返回该数组最后一个和参数相等的对象

public int lastIndexOf(Object o) {
	if (o == null) {
		for (int i = size-1; i >= 0; i--)
			if (elementData[i]==null)
				return i;
    } else {
        for (int i = size-1; i >= 0; i--)
            if (o.equals(elementData[i]))
                return i;
    }
    return -1;
}

从元素尾部开始遍历数组，遇到第一个满足条件的数组元素直接返回其下标。

（6）toArray方法

toArray有两个重载方法：Object[] toArray()和<T> T toArray(T[])
这两个方法的作用就是将数组内所有元素的引用拷贝到一个新的数组中并返回
Object[] toArray()

public Object[] toArray() {
	return Arrays.copyOf(elementData, size);
}

该方法直接调用Arrays.copyOf方法拷贝，该数组包含这个集合中所有的元素的引用。

<T> T toArray(T[])
该方法需要传入一个参数：T[]类型的数组，代表需要拷贝的数组

@SuppressWarnings("unchecked")
public <T> T[] toArray(T[] a) {
	if (a.length < size)
        return (T[]) Arrays.copyOf(elementData, size, a.getClass());
    System.arraycopy(elementData, 0, a, 0, size);
    if (a.length > size)
        a[size] = null;
    return a;
}

首先判断判断传入的数组a能不能存放下该集合所有的元素，如果不够，则调用Arrays.copyOf其中一个重载方法创建一个新的长度为size的数组并将集合中所有的元素的引用拷贝进去然后返回。如果足够，调用System.arraycopy直接拷贝进传入的数组a。接着，如果满足数组a的长度大于集合中所有元素的数量，则将数组尾部置为null作为标记。最后返回拷贝好的数组a。

（7）trimToSize、ensureCapacity方法

这两个方法是ArrayList特有的。主要用于控制数组的长度
void trimToSize()
该方法用于缩减数组长度以减少内存消耗

public void trimToSize() {
	modCount++;
    if (size < elementData.length) {
        elementData = (size == 0) ? EMPTY_ELEMENTDATA : Arrays.copyOf(elementData, size);
	}
}

调用该方法后，elementData的长度和元素的数量一致。
因为ArrayList只会自动扩容而不会自动缩小长度，所以在必要的时候应当调用trimToSize控制好长度避免内存浪费

void ensureCapacity(int)
该方法需要传入一个int参数

public void ensureCapacity(int minCapacity) {
    int minExpand = (elementData != DEFAULTCAPACITY_EMPTY_ELEMENTDATA) ? 0 : DEFAULT_CAPACITY;
    if (minCapacity > minExpand)
        ensureExplicitCapacity(minCapacity);
}

该方法会让数组分配一个指定大小为minCapacity长度的数组，如果minCapacity小于elementData的数组长度，那么会被忽略。
如果通过无参构造器构造ArrayList之后再调用该方法，那么最少也会分配一个长度为10的数组（即使传入的参数小于10）。

（8）addAll方法

addAll有两个重载的方法：boolean addAll(Collection<? extends E>)和boolean addAll(int, Collection<? extends E>)
boolean addAll(Collection<? extends E> c)
该方法将传入的集合c中所有的元素添加到elementData的尾部，并返回true（除非c没有任何元素）

public boolean addAll(Collection<? extends E> c) {
    Object[] a = c.toArray();
    int numNew = a.length;
    ensureCapacityInternal(size + numNew);  // Increments modCount
    System.arraycopy(a, 0, elementData, size, numNew);
    size += numNew;
	return numNew != 0;
}

首先调用集合c的toArray方法获取到这个集合包含的所有对象，然后调用ensureCapacityInternal方法确保elementData有足够的空间，最后再把元素添加到elementData。
boolean addAll(int, Collection<? extends E>)
这个方法将传入的集合中所有的元素从指定的数组下标添加。

public boolean addAll(int index, Collection<? extends E> c) {
	//检查index是否越界
	rangeCheckForAdd(index);

    Object[] a = c.toArray();
    int numNew = a.length;
    //确保elementData长度足够
    ensureCapacityInternal(size + numNew);  // Increments modCount
	
	//移动数组元素
    int numMoved = size - index;
    if (numMoved > 0)
        System.arraycopy(elementData, index, elementData, index + numNew, numMoved);

	//将数组a(包含集合c的元素)从elementData的index处开始添加
    System.arraycopy(a, 0, elementData, index, numNew);
    size += numNew;
    //返回true，除非a.length == 0
    return numNew != 0;
}

（9）removeAll、retainAll方法

boolean removeAll(Collection<?> c)
该方法删除elementData与集合c的交集部分

public boolean removeAll(Collection<?> c) {
	//集合c不可为null，否则抛出NullPointerException
	Objects.requireNonNull(c);
    return batchRemove(c, false);
}

private boolean batchRemove(Collection<?> c, boolean complement) {
    final Object[] elementData = this.elementData;
    int r = 0, w = 0;
    boolean modified = false;
    try {
	    //遍历elementData元素，将集合c中没有的元素依次赋值到elementData
        for (; r < size; r++)
            if (c.contains(elementData[r]) == complement)
                elementData[w++] = elementData[r];
    //finally语句主要是防止c.contains有异常抛出时能保证elementData数据的完整性
    } finally {
	    //如果没有遍历完elementData
        if (r != size) {
	        //将没有遍历到的元素复制到elementData
            System.arraycopy(elementData, r, elementData, w, size - r);
            //size - r的大小等于没有遍历到的元素
            w += size - r;
        }
        //如果有元素被删除
        if (w != size) {
	        //将多余元素设为null
            for (int i = w; i < size; i++)
	            elementData[i] = null;
            modCount += size - w;
            size = w;
            modified = true;
        }
    }
    return modified;
}

如果没有理解上面这个算法可以看图解：

è¿éåå¾çæè¿°

如果Collection c为ArrayList，那么该算法的时间复杂度为O(n^2)。

boolean retainAll(Collection<?> c)
该方法删除elementData和集合c的差集部分

public boolean retainAll(Collection<?> c) {
	//集合c不可为null，否则抛出NullPointerException
    Objects.requireNonNull(c);
	return batchRemove(c, true);
}

同样调用了私有方法batchRemove，只不过complement参数为true

（10）iterator方法

iterator方法继承自Collection接口，用于返回该元素的迭代器用于遍历集合内的元素

 public Iterator<E> iterator() {
	return new Itr();
}

ArrayList的iterator方法实现是返回内部类Itr，Itr类实现了Iterator接口

private class Itr implements Iterator<E> {
	int cursor;
    int lastRet = -1; 
    int expectedModCount = modCount;
    //省略其它方法...
}

Itr类有三个成员变量：
cursor变量用于记录下一个迭代的元素的数组下标
lastRet变量用于记录上一次返回的元素的数组下标
expectedModCount则是modCount的值，主要用来检测在迭代器使用期间有没有修改过ArrayList，修改了之后如果调用迭代器内的next方法，则会抛出ConcurrentModificationException异常。

在了解Itr源码之前，我们先来回顾下Iterator接口

public interface Iterator<E> {
	//是否还有下一个元素，如果返回false则代表迭代完成
    boolean hasNext();
	//返回下一个元素
    E next();
	//移除最后一个调用next返回的元素，默认实现为不支持此操作
    default void remove() {
        throw new UnsupportedOperationException("remove");
    }
	//JDK 1.8引入的方法，Consumer为函数式接口，调用该方法并传入一个Consumer函数可以自动
	//为每一个元素执行函数中定义的操作
    default void forEachRemaining(Consumer<? super E> action) {
        Objects.requireNonNull(action);
        while (hasNext())
            action.accept(next());
    }
}

现在我们再来看Itr对这些方法的实现

@SuppressWarnings("unchecked")
public E next() {
	//检查ArrayList有没有被修改过
	checkForComodification();
	//获取需要返回的数组下标
    int i = cursor;
    //如果迭代完成则抛出异常
    if (i >= size)
        throw new NoSuchElementException();
    Object[] elementData = ArrayList.this.elementData;
    //如果越界则抛出异常
    if (i >= elementData.length)
        throw new ConcurrentModificationException();
    cursor = i + 1;
    return (E) elementData[lastRet = i];
}

public void remove() {
	//保证没有连续两次调用remove方法或没有调用过next方法
	if (lastRet < 0)
		throw new IllegalStateException();
	//检查ArrayList有没有被修改过
	checkForComodification();
    try {
	    //调用ArrayList实例的remove方法移除
		ArrayList.this.remove(lastRet);
		//将cursor减1
        cursor = lastRet;
        //防止连续两次调用此方法
        lastRet = -1;
        //移除一个对象后，modCount会自增1
        expectedModCount = modCount;
    } catch (IndexOutOfBoundsException ex) {
		throw new ConcurrentModificationException();
    }
}

@Override @SuppressWarnings("unchecked")
public void forEachRemaining(Consumer<? super E> consumer) {
	Objects.requireNonNull(consumer);
    final int size = ArrayList.this.size;
    int i = cursor;
    if (i >= size) {
	    return;
    }
    final Object[] elementData = ArrayList.this.elementData;
    if (i >= elementData.length) {
	    throw new ConcurrentModificationException();
    }
    //从cursor开始执行consumer中的accpet方法直到遍历完成
    while (i != size && modCount == expectedModCount) {
	    consumer.accept((E) elementData[i++]);
    } 
    //更新cursor、lastRet的值
    cursor = i;
    lastRet = i - 1;
    checkForComodification();
}

关于迭代器的方法还有listIterator()和listIterator(int)，具体实现也大同小异，这里就不再详细讨论了。

其他要点

（1）ArrayList的序列化

先来回顾下：
在序列化和反序列化过程中需要特殊处理的类必须使用下列准确签名来实现特殊方法：
private void writeObject(java.io.ObjectOutputStream out) throws IOException
private void readObject(java.io.ObjectInputStream in) throws IOException, ClassNotFoundException
writeObject用来写入信息，readObject用于读取信息

ArrayList存储对象的elementData是用transient修饰的，那为什么在反序列化的时候仍可将其读出呢，答案就在writeObject方法中。

private void writeObject(ObjectOutputStream s) throws IOException{
	int expectedModCount = modCount;
    s.defaultWriteObject();
    s.writeInt(size);
 
    for (int i=0; i<size; i++)
		s.writeObject(elementData[i]);
	//防止在序列化过程中有尝试修改ArrayList的行为
    if (modCount != expectedModCount) {
        throw new ConcurrentModificationException();
    }
}

可以看出，writeObject通过一个for循环将elementData里面所有的元素写入序列化文件。

private void readObject(java.io.ObjectInputStream s) throws IOException, ClassNotFoundException {
        elementData = EMPTY_ELEMENTDATA;
        s.defaultReadObject();
        s.readInt(); 
        if (size > 0) {
            ensureCapacityInternal(size);
            Object[] a = elementData;
            for (int i=0; i<size; i++) {
                a[i] = s.readObject();
		}
	}
}

在读序列化文件的时候，先读出size元素的值，再根据size分配足够大的数组，然后通过for循环将数组中的元素读入。

ArrayList通过这种方式读取的好处是可以节省内存空间，因为在读的时候会根据元素的实际大小分配数组，而不会预留空间（除非小于元素数量小于10）。

（2）ArrayList的RandomAccess
ArrayList实现类RandomAccess接口（是一个标记接口），说明它支持快速访问。
RandomAccess接口主要用在Collections工具类上，Collections提供了大量静态方法操作集合，在需要遍历元素的时候，会根据一个集合是否实现了RandomAccess接口来采取用for循环遍历还是用迭代器遍历。对于ArrayList来说，采用for循环遍历更快，对于LinkedList来说，采用迭代器遍历更快。
可以参考这篇博客：https://blog.youkuaiyun.com/weixin_39148512/article/details/79234817

参考：https://blog.youkuaiyun.com/abc123lzf/article/details/82154383