我们在序言中讲过ArrayList的数据结构,他的数据存储方式是数组。这一章我们结合源代码来细讲他的实现和一些API的用法。
public class ArrayList<E> extends AbstractList<E>
implements List<E>, RandomAccess, Cloneable, java.io.Serializable
{
private static final long serialVersionUID = 8683452581122892189L;
transient Object[] elementData; // non-private to simplify nested class access
/**
* The size of the ArrayList (the number of elements it contains).
*
* @serial
*/
private int size;
我们可以看到ArrayList继承了AbstractList,实现接口List接口,并且实现了序列化。接下来我们看看他的构造函数。
public ArrayList(int initialCapacity) {
if (initialCapacity > 0) {
this.elementData = new Object[initialCapacity];
} else if (initialCapacity == 0) {
this.elementData = EMPTY_ELEMENTDATA;
} else {
throw new IllegalArgumentException("Illegal Capacity: "+
initialCapacity);
}
}
/**
* Constructs an empty list with an initial capacity of ten.
*/
public ArrayList() {
this.elementData = DEFAULTCAPACITY_EMPTY_ELEMENTDATA;
}
我们可以在创建实例的时候,既可以自己传入表长度,也可以使用系统默认的长度为0的表。
我们可以看到this.elementData便是一个用来存储数据的 Object类型数组。
接下来看一些API的实现
1.add
public boolean add(E e) {
ensureCapacityInternal(size + 1); // Increments modCount!!
elementData[size++] = e;
return true;
}
private void ensureCapacityInternal(int minCapacity) {
if (elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA) {
minCapacity = Math.max(DEFAULT_CAPACITY, minCapacity);
}
ensureExplicitCapacity(minCapacity);
}
private void ensureExplicitCapacity(int minCapacity) {
modCount++;
// overflow-conscious code
if (minCapacity - elementData.length > 0)
grow(minCapacity);
}
private void grow(int minCapacity) {
// overflow-conscious code
int oldCapacity = elementData.length;
int newCapacity = oldCapacity + (oldCapacity >> 1);
if (newCapacity - minCapacity < 0)
newCapacity = minCapacity;
if (newCapacity - MAX_ARRAY_SIZE > 0)
newCapacity = hugeCapacity(minCapacity);
// minCapacity is usually close to size, so this is a win:
elementData = Arrays.copyOf(elementData, newCapacity);
}
我们可以看到,添加数据默认在末尾添加,并且根据存储数组的长度来判断是否要增加数组长度。增加数组的长度是通过创建一个新数组,并且把数据复制过去。实际上也就是新建数组,并且指针转移。
2.remove
public boolean remove(Object o) {
if (o == null) {
for (int index = 0; index < size; index++)
if (elementData[index] == null) {
fastRemove(index);
return true;
}
} else {
for (int index = 0; index < size; index++)
if (o.equals(elementData[index])) {
fastRemove(index);
return true;
}
}
return false;
}
private void fastRemove(int index) {
modCount++;
int numMoved = size - index - 1;
if (numMoved > 0)
System.arraycopy(elementData, index+1, elementData, index,
numMoved);
elementData[--size] = null; // clear to let GC do its work
}
移除的时候是直接把index后面的所有数据往前面移动,然后把最后一个置空。注意:存储数组并没有改变长度,只是把最后一个存储的内容置空了。
3.addAll
public boolean addAll(Collection<? extends E> c) {
Object[] a = c.toArray();
int numNew = a.length;
ensureCapacityInternal(size + numNew); // Increments modCount
System.arraycopy(a, 0, elementData, size, numNew);
size += numNew;
return numNew != 0;
}
addAll最多只执行一次数组扩容和数据复制。
4.removeAll
public boolean removeAll(Collection<?> c) {
Objects.requireNonNull(c);
return batchRemove(c, false);
}
private boolean batchRemove(Collection<?> c, boolean complement) {
final Object[] elementData = this.elementData;
int r = 0, w = 0;
boolean modified = false;
try {
for (; r < size; r++)
if (c.contains(elementData[r]) == complement)
elementData[w++] = elementData[r];
} finally {
// Preserve behavioral compatibility with AbstractCollection,
// even if c.contains() throws.
if (r != size) {
System.arraycopy(elementData, r,
elementData, w,
size - r);
w += size - r;
}
if (w != size) {
// clear to let GC do its work
for (int i = w; i < size; i++)
elementData[i] = null;
modCount += size - w;
size = w;
modified = true;
}
}
return modified;
}
批量移除的方法比较复杂,主要是这一段
for (; r < size; r++)
if (c.contains(elementData[r]) == complement)
elementData[w++] = elementData[r];
这一段的意思是把不需要移除的项拿出来,从原数组第一个开始逐个往后覆盖原数组。最后得到的就是不需要移除的n个项会依次排列在数组的前面,而从n往后面的项置空,则就得到了最后不需要移除的项组成的数组。这里w在项不需要移除r项的时候会自增,并且通过r的每次都递增来得到当前项,把r项放到w项。到需要移除的r项时,w项则不自增使得并且不赋值,使得r项被遗弃。
用语言描述可能有点难以理解,我们用画图的形式来说明

因为contains里面也涉及查找元素,所以批量删除时间复杂度O(M*N),会比较消耗时间。
5.remove(Object)
public boolean remove(Object o) {
if (o == null) {
for (int index = 0; index < size; index++)
if (elementData[index] == null) {
fastRemove(index);
return true;
}
} else {
for (int index = 0; index < size; index++)
if (o.equals(elementData[index])) {
fastRemove(index);
return true;
}
}
return false;
}
private void fastRemove(int index) {
modCount++;
int numMoved = size - index - 1;
if (numMoved > 0)
System.arraycopy(elementData, index+1, elementData, index,
numMoved);
elementData[--size] = null; // clear to let GC do its work
}
单个移除的时候需要找到这个项的index,再从index开始把后面的所有项前移,然后最后一个项置空。所以时间复杂度最坏的情况下是O(N*N)。
6.clear
public void clear() {
modCount++;
// clear to let GC do its work
for (int i = 0; i < size; i++)
elementData[i] = null;
size = 0;
}
时间复杂度为N
7.contains
public boolean contains(Object o) {
return indexOf(o) >= 0;
}
public int indexOf(Object o) {
if (o == null) {
for (int i = 0; i < size; i++)
if (elementData[i]==null)
return i;
} else {
for (int i = 0; i < size; i++)
if (o.equals(elementData[i]))
return i;
}
return -1;
}
时间复杂度O(N)
8.retainAll 取两个表的交集
public boolean retainAll(Collection<?> c) {
Objects.requireNonNull(c);
return batchRemove(c, true);
}
private boolean batchRemove(Collection<?> c, boolean complement) {
final Object[] elementData = this.elementData;
int r = 0, w = 0;
boolean modified = false;
try {
for (; r < size; r++)
if (c.contains(elementData[r]) == complement)
elementData[w++] = elementData[r];
} finally {
// Preserve behavioral compatibility with AbstractCollection,
// even if c.contains() throws.
if (r != size) {
System.arraycopy(elementData, r,
elementData, w,
size - r);
w += size - r;
}
if (w != size) {
// clear to let GC do its work
for (int i = w; i < size; i++)
elementData[i] = null;
modCount += size - w;
size = w;
modified = true;
}
}
return modified;
}
算法跟removeAll差不多,唯一不同的就是取相同项排列到数组前端,后面的项舍弃。
这样取交集的方法方法比下面的方法可取
ArrayList a;
ArrayList b;
ArrayList c;
for(Object o :a){
if(b.contains(a)){
c.add(a);//add会涉及到数组扩容和数据复制。增大时间复杂度。
}
}
9.trimToSize 将数组长度设置为数据长度。
public void trimToSize() {
modCount++;
if (size < elementData.length) {
elementData = (size == 0)
? EMPTY_ELEMENTDATA
: Arrays.copyOf(elementData, size);
}
}
我们在移除数据的时候,只是将数组的某一项置空,并没有缩小数组。当有大量的数据被移除时,建议调用这个函数。应为这是一串连续的内存,数据移除后,数组索引还在,所以仍然被占用。Arrays.copyOf会新建一个长度适合的数组,而释放之前的数组引用。
注意:1.在添加数据的时候,如果频繁的拓展数组长度就要不断的新建数组,转移数据。这会大大增加时间复杂度。所以能使用addAll一次性添加的,尽量不要重复用add单个元素。如果能多个一起删除的,尽量不要重复用remove单个元素移除。
2.在移除数据的时候,如果能用removeAll的情况尽量用removeAll不要逐个的remove,否则时间复杂度会很大。
3.retainAll是取两个列表交集的很好的算法。
4.有大量数据移除时记得调用trimToSize
-
本文深入剖析ArrayList的内部实现,包括其作为数组的数据结构,构造函数、add、remove、addAll、removeAll等API的源码分析,以及如何避免频繁扩容和优化操作。了解序列化、数组调整与移除策略。
4692

被折叠的 条评论
为什么被折叠?



