ArrayList和LinkedList的主要区别:
1.ArrayList是实现了基于动态数组的数据结构,LinkedList是基于链表的数据结构;
2.对于随机访问get和set,ArrayList优于LinkedList,因为LinkedList要移动指针。
3.对于新增和删除操作add和remove,LinedList比较占优势,因为ArrayList要移动数据。
ArrarList 源码分析
简介
ArrayList 是一个数组队列,与Java中的数组相比,它的容量能动态增长,相当于动态数组。
它继承于AbstractList,实现了List, RandomAccess, Cloneable, java.io.Serializable这些接口。
ArrayList继承了AbstractList,实现了List,是一个数组队列,提供了添加、删除、修改、遍历等功能。
ArrayList 实现了RandomAccess接口,即提供了随机访问功能,
RandmoAccess是java中用来被List实现,为List提供快速访问功能,
在ArrayList中,可以通过元素的序号快速获取元素对象,这就是快速随机访问。
ArrayList 实现了Cloneable接口,即覆盖了clone()方法,能被克隆。
ArrayList 实现了java.io.Serializable接口,这意味着ArrayList支持序列化,能通过序列化去传输。
和Vector不同,ArrayList中的操作不是线程安全的!所以,建议在单线程中才使用ArrayList,而在多线程中
可以选择Vector或者CopyOnWriteArrayList。
- 允许所有元素,包括null,元素可重复。
- 方法size、isEmpty、get、set、iterator和listIterator的调用是常数时间的。
- 添加删除的时间复杂度为O(N),其他所有操作也都是线性时间复杂度。
ArrayList构造函数
# 默认构造函数
ArrayList()
# capacity是ArrayList的默认容量大小,
# 当由于增加数据导致容量不足时,容量会添加上一次容量大小的一半
ArrayList(int capacity)
# 创建一个包含collection的ArrayList
ArrayList(Collection<? extends E> collection)
ArrayList的API
# Collection中定义的API
boolean add(E object)
boolean addAll(Collection<? extends E> collection)
void clear()
boolean contains(Object object)
boolean containsAll(Collection<?> collection)
boolean equals(Object object)
int hashCode()
boolean isEmpty()
Iterator<E> iterator()
boolean remove(Object object)
boolean removeAll(Collection<?> collection)
boolean retainAll(Collection<?> collection)
int size()
<T> T[] toArray(T[] array)
Object[] toArray()
# AbstractCollection中定义的API
void add(int location, E object)
boolean addAll(int location, Collection<? extends E> collection)
E get(int location)
int indexOf(Object object)
int lastIndexOf(Object object)
ListIterator<E> listIterator(int location)
ListIterator<E> listIterator()
E remove(int location)
E set(int location, E object)
List<E> subList(int start, int end)
# ArrayList新增的API
Object clone()
void ensureCapacity(int minimumCapacity)
void trimToSize()
void removeRange(int fromIndex, int toIndex)
ArrayList的继承关系
java.lang.Object
-> java.util.AbstractCollection<E>
-> java.util.AbstractList<E>
-> java.util.ArrayList<E>
ArrayList类声明
public class ArrayList<E> extends AbstractList<E>
implements List<E>, RandomAccess, Cloneable, java.io.Serializable {}
ArrayList与Collection关系如下图
ArrayList包含了两个重要的对象:elementData 和 size。
(1) elementData 是”Object[]类型的数组”,它保存了添加到ArrayList中的元素。
实际上,elementData是个动态数组,能通过构造函数 ArrayList(int initialCapacity)来执行它的初始容量为initialCapacity;如果通过不含参数的构造函数ArrayList()来创建ArrayList,则elementData的容量默认是10。elementData数组的大小会根据ArrayList容量的增长而动态的增长,具体的增长方式,请参考源码分析中的ensureCapacity()函数。
(2) size 则是动态数组的实际大小。
构造函数
# 默认容量
private static final int DEFAULT_CAPACITY = 10;
# 空数组,调用者指定数组的容量为 0
private static final Object[] EMPTY_ELEMENTDATA = {};
# 默认的空数组,即调用者没有传容量大小,与上面的区别是该变量可以控制后面的动态扩容
private static final Object[] DEFAULTCAPACITY_EMPTY_ELEMENTDATA = {};
# 存放元素数据的数组
# non-private to simplify nested class access
transient Object[] elementData;
# 数据元素的个数
private int size;
//构造一个指定容量的ArrayList
public ArrayList(int initialCapacity) {
if (initialCapacity > 0) {
this.elementData = new Object[initialCapacity];
} else if (initialCapacity == 0) {
this.elementData = EMPTY_ELEMENTDATA;
} else {
throw new IllegalArgumentException("Illegal Capacity: "+
initialCapacity);
}
}
//构造一个默认的空ArrayList,这里并没有初始化,jdk 1.8之后是在进行add操作后初始化
public ArrayList() {
this.elementData = DEFAULTCAPACITY_EMPTY_ELEMENTDATA;
}
//构造一个具有指定元素的ArrayList
public ArrayList(Collection<? extends E> c) {
elementData = c.toArray();
if ((size = elementData.length) != 0) {
// c.toArray might (incorrectly) not return Object[] (see 6260652)
if (elementData.getClass() != Object[].class)
elementData = Arrays.copyOf(elementData, size, Object[].class);
} else {
// replace with empty array.
this.elementData = EMPTY_ELEMENTDATA;
}
}
这里,通过传进来的初始化容量值来为数组分配空间,如果为 0 ,分配一个空数组,在第一个元素添加的时候,再去动态分配空间;
ArrayList构造函数,本质上做的事情就是为数组分配空间,顺序存储就是要预先分配一定的空间;
当我们 new ArrayList(10) ,实际上 elementData 的数组就分配了 10 个地址连续的存储单元。
有两个空数组的成员变量说明一下,EMPTY_ELEMENTDATA 是指定 ArrayList 容量为 0 或传入一个空集合时 使用的,而 DEFAULTCAPACITY_EMPTY_ELEMENTDATA 是默认的空数组,即 new ArrayList(),
但是没有传参数。定义两个变量的是为了后面给数组分配空间时分配多少使用的。
添加元素
public boolean add(E e) {
# Increments modCount
ensureCapacityInternal(size + 1);
elementData[size++] = e;
return true;
}
# 在某个位置加入一个元素element
# @param index
# @param element
public void add(int index, E element) {
# 检查index是否越界
rangeCheckForAdd(index);
# 进行扩容检查
ensureCapacityInternal(size + 1);
# 对数据进行复制操作,空出index位置,并插入element,后移index后面的元素
System.arraycopy(elementData, index, elementData, index + 1,size - index);
elementData[index] = element;
size++;
}
扩容检查
# 这个扩容方法,内部没有调用,判断ArrayList是否为空
# @param minCapacity
public void ensureCapacity(int minCapacity) {
int minExpand = (elementData != DEFAULTCAPACITY_EMPTY_ELEMENTDATA)
? 0
: DEFAULT_CAPACITY;
if (minCapacity > minExpand) {
ensureExplicitCapacity(minCapacity);
}
}
private void ensureCapacityInternal(int minCapacity) {
# 判断没有传容量参数时,进行动态分配容量
if (elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA) {
minCapacity = Math.max(DEFAULT_CAPACITY, minCapacity);
}
ensureExplicitCapacity(minCapacity);
}
private void ensureExplicitCapacity(int minCapacity) {
modCount++;
# overflow-conscious code
if (minCapacity - elementData.length > 0)
grow(minCapacity);
}
private static final int MAX_ARRAY_SIZE = Integer.MAX_VALUE - 8;
private void grow(int minCapacity) {
# overflow-conscious code
int oldCapacity = elementData.length;
int newCapacity = oldCapacity + (oldCapacity >> 1);
if (newCapacity - minCapacity < 0)
newCapacity = minCapacity;
if (newCapacity - MAX_ARRAY_SIZE > 0)
newCapacity = hugeCapacity(minCapacity);
// minCapacity is usually close to size, so this is a win:
elementData = Arrays.copyOf(elementData, newCapacity);
}
private static int hugeCapacity(int minCapacity) {
if (minCapacity < 0) // overflow
throw new OutOfMemoryError();
return (minCapacity > MAX_ARRAY_SIZE) ?
Integer.MAX_VALUE :
MAX_ARRAY_SIZE;
}
在 add 方法里,并没有直接将元素添加到 size 的位置中,而是先进行了一个容量的判断,
这里解决的问题就是,假使预先没有分配容量或者分配的容量已经用完,可以动态的分配容量,而不至于让元
素添加不进去;
ensureCapacityInternal 内部容量确认的方法里,首先判断是不是默认就没有分配容量,
即直接 new ArrayList(),不传参数,如果是这样,就给该数组分配 DEFAULT_CAPACITY(默认值10) 和
指定最小容量 minCapacity 两个值中的最大值。
换句话说,当我们直接 new ArrayList(),不分配容量,就会在添加第一个元素前,设置最小容量
minCapacity 为 10。
内部容量的确认主要就是为上面这种不传参数的构造方法使用的,当内部容量确认好后,
ensureExplicitCapacity 方法内部就通过与现有数组长度的比较,条件符合后,准备开始增长容量。
grow() 方法内部,计算出了一个比较合适的容量值,并将原有数据拷贝到新的数组里面,重新赋给
elementData 数组。多数情况下,容量增长的长度为原有容量的一半,初始不分配,第一次增长为 10。
ArrayList 的 add 方法还有一个重载方法,add(int index,E element),在指定位置插入元素,原理与它的
remove(int index) 类似,所以下面就以 remove(int index) 分析数组指定位置的删除操作。
删除元素
public E remove(int index) {
rangeCheck(index);
modCount++;
E oldValue = elementData(index);
int numMoved = size - index - 1;
if (numMoved > 0)
System.arraycopy(elementData, index+1, elementData, index,numMoved);
# clear to let GC do its work
elementData[--size] = null;
return oldValue;
}
private void rangeCheck(int index) {
if (index >= size)
throw new IndexOutOfBoundsException(outOfBoundsMsg(index));
}
# 根据元素内容匹配并删除,只删除第一个匹配成功的
# @param o
# @return
public boolean remove(Object o) {
if (o == null) {
for (int index = 0; index < size; index++)
if (elementData[index] == null) {
fastRemove(index);
return true;
}
} else {
for (int index = 0; index < size; index++)
if (o.equals(elementData[index])) {
fastRemove(index);
return true;
}
}
return false;
}
#找到对应的元素后,删除。删除元素后的元素都向前移动一位
private void fastRemove(int index) {
modCount++;
int numMoved = size - index - 1;
if (numMoved > 0)
System.arraycopy(elementData, index+1, elementData, index,
numMoved);
elementData[--size] = null; // clear to let GC do its work
}
在删除操作中,首先检查要删除位置的范围,不在数组长度内,抛出数组越界异常;
计算出从要删除的位置开始,到数组最后一位的元素个数,即要向前移动一位的元素个数;
从 index + 1 开始,以及往后的元素,向前移动一位,并将数组的最后一位元素置为空,size
减少一个,将删除的值返回。
可见,顺序存储的指定位置的增删需要移动多个元素,效率不高。
修改和查询
public E set(int index, E element) {
rangeCheck(index);
E oldValue = elementData(index);
elementData[index] = element;
return oldValue;
}
public E get(int index) {
rangeCheck(index);
return elementData(index);
}
修改和查询之前,先校验一下角标,然后直接取出对应位置的值就可以了。
至此,ArrayList 的增删改查的分析就完成了,源码还有一部分,是迭代器相关的,集合共有的东西;
基于以上的分析,可以知道,再对一个集合进行删除操作时,集合的 size 会减一,如果通过 for
循环遍历对集合进行移除操作,最后一定会出现数据不对的情况,为了避免这种情况,就应该使用迭代器操作
迭代器
public E next() {
checkForComodification();
int i = cursor;
if (i >= size)
throw new NoSuchElementException();
Object[] elementData = ArrayList.this.elementData;
if (i >= elementData.length)
throw new ConcurrentModificationException();
cursor = i + 1;
return (E) elementData[lastRet = i];
}
public void remove() {
if (lastRet < 0)
throw new IllegalStateException();
checkForComodification();
try {
ArrayList.this.remove(lastRet);
cursor = lastRet;
lastRet = -1;
expectedModCount = modCount;
} catch (IndexOutOfBoundsException ex) {
throw new ConcurrentModificationException();
}
}
final void checkForComodification() {
if (modCount != expectedModCount)
throw new ConcurrentModificationException();
}
这里,每次调用 next() 方法,取出的元素实际上是 cursor 所指角标的元素,将这个角标的值赋给 lastRet,即最近迭代的位置;
在 remove() 方法里,移除了当前取出的元素后,将 cursor 的值设为 lastRet,什么意思?就是集合虽然移除了一位元素,size - 1 了,但我下次取元素的时候,
还是取的刚才移除元素的后一位元素,保证了每次按元素的原始次序迭代。
总结
1.对ArrayList和LinkedList而言,在列表末尾增加一个元素所花的开销都是固定的。对ArrayList而言,主要是在内部数组中增加一项,指向所添加的元素,偶尔可能会导致对数组重新进行分配;而对LinkedList而言,这个开销是统一的,分配一个内部Entry对象。
2.在ArrayList的中间插入或删除一个元素意味着这个列表中剩余的元素都会被移动;而在LinkedList的中间插入或删除一个元素的开销是固定的。
3.LinkedList不支持高效的随机元素访问。
4.ArrayList的空间浪费主要体现在在list列表的结尾预留一定的容量空间,而LinkedList的空间花费则体现在它的每一个元素都需要消耗相当的空间
可以这样说:当操作是在一列数据的后面添加数据而不是在前面或中间,并且需要随机地访问其中的元素时,使用ArrayList会提供比较好的性能;当你的操作是在一列数据的前面或中间添加或删除数据,并且按照顺序访问其中的元素时,就应该使用LinkedList了。