什么是数组?
数组是一种线性表数据结构,它用一组连续的内存空间,来存储一组具有相同类型的数据。
- 线性表就是数据排成像一条线一样的结构,每个线性表上的数据最多只有前和后两个方向。其实除了数组,链表,队列,栈等也是线性表结构
非线性表,数据之间并不是简单的前后关系,比如二叉树,堆,图等。
2.连续的内存空间和相同类型的数据
优点:随机访问
缺点:插入删除将做大量数据搬移
如何实现随机访问?
计算机会给每个内存单元分配一个地址,计算机通过地址来访问内存中的数据。当计算机需要随机访问数组中的某个元素时,会首先通过寻址公式,计算出该元素存储的内存地址
a[i]_address = base_address + i*data_type_size
查找的时间复杂度
链表适合插入,删除,时间复杂度为O(1);数组适合查找,查找时间复杂度为O(1);
上面这种说法是错误的,数组是适合查找操作,但是查找的时间复杂度并不为O(1),即便是排好序的数组,你用二分查找,时间复杂度也是O(logn)。所以,应该这样说,数组支持随机访问,根据下标随机访问的时间复杂度为O(1)
低效的”插入”和”删除”
插入:
数组末尾插入:时间复杂度为O(1)
数组开头插入:时间复杂度为O(n)
因为我们在每个位置插入元素的概率一样,所以平均情况时间复杂度为(1+2+…n)/n=O(n)
优化:数组若无序,插入新的元素时,可以将第K个位置元素移动到数组末尾,把新的元素,插入到第K个位置,此处复杂度为O(1)
删除:
和插入一样,最好O(1)最坏O(n)平均O(n)
提高删除效率:将多次删除操作中集中在一起执行,可以记录下已经被删除的数据,每次的删除操作并不是搬移数据,只是记录数据已经被删除,当数组没有更多的存储空间时,再触发一次真正的删除操作。即JVM标记清除垃圾回收算法
数组访问越界问题:
C语言中的数据越界是一种未决行为,是编程语言和编译器都相关的,一般比较难发现的逻辑错误。相比之下,Java会有越界检查
容器能否完全替代数组
容器的优势:
ArrayList最大的优势就是可以将很多数组操作的细节封装起来,比如前面提到的数组插入,删除数据时需要搬移其他数据等,还有一个就是支持动态扩容。
数组本身在定义的时候需要预先指定大小,因为需要分配连续的内存空间。如果我们申请了大小为 10 的数组,当第 11 个数据需要存储到数组中时,我们就需要重新分配一块更大的空间,将原来的数据复制过去,然后再将新的数据插入。
如果使用 ArrayList,我们就完全不需要关心底层的扩容逻辑,ArrayList 已经帮我们实现好了。每次存储空间不够的时候,它都会将空间自动扩容为 1.5 倍大小。
不过,这里需要注意一点,因为扩容操作涉及内存申请和数据搬移,是比较耗时的。所以,如果事先能确定需要存储的数据大小,最好在创建 ArrayList 的时候事先指定数据大小。
使用数组的情况:
-
Java ArrayList无法存储基本类型,比如int,long,需要封装为Integer,Long类,而自动装箱和拆箱则有一定的性能消耗,所以如果特别关注性能,或者希望使用基本类型,就可以选用数组
-
如果数据大小事先已知,并且对数据的操作非常简单,用不到ArrayList提供的大部分方法,也可以选用数组
-
当要表示多维数组时,用数组往往会更加直观。比如Object[][] array;而用容器的话则需要这样定义:ArrayList array。
总结:
对于业务开发,直接使用容器就足够了,省时省力。毕竟损耗一丢丢性能,完全不会影响到系统整体的性能。但如果你是做一些非常底层的开发,比如开发网络框架,性能的优化需要做到几只,这个时候数组就会优于容器,称为首选。