ArrayList是最常用的集合类之一,下面我们结合源代码分析ArrayList的实现方式。
继承体系
ArrayList继承自AbstractList实现了List接口、Serializable接口、Cloneable接口、RandomAccess接口
- List接口,包括List的主要方法也是用的最多的方法。
- Serializable接口为标记接口表示支持序列化与反序列化。
- RandomAccess接口为标记接口,表示ArrayList支持通过下标进行随机访问。
- Cloneable接口表示ArrayList支持clone()方法来进行对象实例的克隆。
源码实现
ArrayList是List的子类之一,有一个主要的特征就是ArrayList是通过可变长的数组来实现的。在日常的开发中我们使用ArrayList一般都是通过List接口封装来调用List接口中定义的方法,与其他不同实现的子类基本没有什么区别。所以我们下面就围绕这个主要的区别来分析ArrayList的源代码。
初始化过程
既然是通过数组来实现,那么ArrayList内部肯定要维护一个数组用来保存数据,可以看到有一个elementData数字类型字段就是用来保存对象的,ArrayList对象的所有操作可以说都是围绕elementData来进行的。数组有一个特性就是长度是固定的,那么ArrayList初始化的过程也就是这个elementData对象的初始化过程。主要就是确定初始化时elementData数组的长度。
/**
* Default initial capacity.
*/
private static final int DEFAULT_CAPACITY = 10;
/**
* Shared empty array instance used for empty instances.
*/
private static final Object[] EMPTY_ELEMENTDATA = {};
/**
* Shared empty array instance used for default sized empty instances. We
* distinguish this from EMPTY_ELEMENTDATA to know how much to inflate when
* first element is added.
*/
private static final Object[] DEFAULTCAPACITY_EMPTY_ELEMENTDATA = {};
/**
* The array buffer into which the elements of the ArrayList are stored.
* The capacity of the ArrayList is the length of this array buffer. Any
* empty ArrayList with elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA
* will be expanded to DEFAULT_CAPACITY when the first element is added.
*/
transient Object[] elementData; // non-private to simplify nested class access
ArrayList提供了三个构造方法如下:
/**
* 指定初始化容量
*
* @param initialCapacity 初始化容量
* @throws IllegalArgumentException if the specified initial capacity
* is negative
*/
public ArrayList(int initialCapacity) {
if (initialCapacity > 0) {
this.elementData = new Object[initialCapacity];
} else if (initialCapacity == 0) {
this.elementData = EMPTY_ELEMENTDATA;
} else {
throw new IllegalArgumentException("Illegal Capacity: "+
initialCapacity);
}
}
/**
* 不指定初始化容量,默认容量为10,初始化时elementData等于DEFAULTCAPACITY_EMPTY_ELEMENTDATA空数 * 组
*/
public ArrayList() {
this.elementData = DEFAULTCAPACITY_EMPTY_ELEMENTDATA;
}
/**
* 传入一个集合,将集合中的全部元素存入ArrayList
*/
public ArrayList(Collection<? extends E> c) {
elementData = c.toArray();
if ((size = elementData.length) != 0) {
// c.toArray might (incorrectly) not return Object[] (see 6260652)
if (elementData.getClass() != Object[].class)
elementData = Arrays.copyOf(elementData, size, Object[].class);
} else {
// replace with empty array.
this.elementData = EMPTY_ELEMENTDATA;
}
}
可以看到当不指定容量时,elementData默认为DEFAULTCAPACITY_EMPTY_ELEMENTDATA这个空数组,如果容量为0时,elementData为EMPTY_ELEMENTDATA,这主要是为了区分用户是否指定了初始化容量,通过构造方法传递参数指定容量为0的空数组和不指定容量时的空数组,在扩容策略上是不一样的。
扩容过程
当向初始化好的ArrayList中添加元素时,由于数组长度是固定的所以要确定是否需要进行扩容。我们来看一下add方法。
/**
* 添加数据的方法
*/
public boolean add(E e) {
ensureCapacityInternal(size + 1); // Increments modCount!!
elementData[size++] = e;
return true;
}
/**
* 检查容量是否需要扩充
*/
private void ensureCapacityInternal(int minCapacity) {
ensureExplicitCapacity(calculateCapacity(elementData, minCapacity));
}
/**
* 当前需要的容量
*/
private static int calculateCapacity(Object[] elementData, int minCapacity) {
if (elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA) {
return Math.max(DEFAULT_CAPACITY, minCapacity);
}
return minCapacity;
}
/**
* 比较当前需要的容量与当前实际容量,需要扩充调用grow方法扩充
*/
private void ensureExplicitCapacity(int minCapacity) {
modCount++;
// overflow-conscious code
if (minCapacity - elementData.length > 0)
grow(minCapacity);
}
/**
* 扩充容量
*/
private void grow(int minCapacity) {
// overflow-conscious code
int oldCapacity = elementData.length;
int newCapacity = oldCapacity + (oldCapacity >> 1);
if (newCapacity - minCapacity < 0)
newCapacity = minCapacity;
if (newCapacity - MAX_ARRAY_SIZE > 0)
newCapacity = hugeCapacity(minCapacity);
// minCapacity is usually close to size, so this is a win:
elementData = Arrays.copyOf(elementData, newCapacity);
}
/**
* 超大容量处理
*/
private static int hugeCapacity(int minCapacity) {
if (minCapacity < 0) // overflow
throw new OutOfMemoryError();
return (minCapacity > MAX_ARRAY_SIZE) ?
Integer.MAX_VALUE :
MAX_ARRAY_SIZE;
}
可以看到add方法中首先调用了ensureCapacityInternal方法来进行容量的检查。首先计算出一个最小容量即当前容量+1,如果当前elementData为DEFAULTCAPACITY_EMPTY_ELEMENTDATA则表示此对象是同过无参构造方法创建的默认容量的ArrayList。取默认容量和当前需要的最小容量两者中的较大值,然后再与实际容量比较,如果大于了当前elementData的容量,表示需要扩容。此时调用grow方法进行扩容。
通过oldCapacity + (oldCapacity >> 1);将当前容量扩充为当前容量的1.5倍,然后检查容量是否够用了,如果还不够直接改变容量为计算出的最小需要的容量。如果容量过大设置容量为Integer.MAX_VALUE。然后通过**Arrays.copyOf(elementData, newCapacity);**将当前数组复制到一个新的数组中。然后将新增的元素添加到对应下标的位置中去,新增元素的操作就结束了。
获取元素
ArrayList获取元素特别简单高效,直接通过下标获取数组中的值。
//获取元素
public E get(int index) {
rangeCheck(index);
return elementData(index);
}
//检查下标是否有效,越界抛出IndexOutOfBoundsException异常
private void rangeCheck(int index) {
if (index >= size)
throw new IndexOutOfBoundsException(outOfBoundsMsg(index));
}
遍历方式
ArrayList常用的有三种遍历方式
- 通过下标遍历
- 增强for循环遍历
- 迭代器遍历
其中由于ArrayList自身通过数组实现的缘故,通过下标遍历最为高效。后面两种本质上是一样的增强for循环也是使用迭代器遍历实现的。
java8之后Iterable增加了forEach方法接收一个Consumer消费对象来处理集合中的数据, 集合类增加了流式遍历。但是目前用的很少,可以了解一下。
SubList方法
List接口中有一个SubList方法,用于返回集合的一部分。这里需要注意在ArrayList中的SubList方法是通过ArrayList自己维护的一个内部类SubList实现的,返回的List对象的实际类型为ArrayList.SubList,不能强制转为ArrayList等对象。subList()方法返回的是ArrayList自身数据的一个视图,对subList()返回的集合的操作也会反应的ArrayList自身。