先上图看得直观点:
从上图很明显可以看出List集合和Set集合均继承自Collection接口,但是Map是独立的,并且他们都是import java.util.List/Set/Map;
1.List (L是重点,圈起来会考)
从文档中我们可以看到List是有序的集合也称为序列(L)。
这里给大家抽象个快速牢记的办法:
List集合有序可重复,上体育课的时候老师是不是会让我们排好队。来晚的童鞋也要排好队,我们有好多个同学不是一个是不是。童鞋们是不是要有序的排成2队男女各一队。然后老师吹着哨子喊道:立(L)正!稍(S)息。脑子里有没有画面?下次想到List就会自然而然就会想到上PE课。
so ,List下常用的实现类:ArrayList,LinkedList,Vector 是不是都有是有序可重复的? OK 下面我们来具体了解ArrayList。
1.1、ArrayList
ArrayList的底层数据结构是数组,查询快,增删慢。
可以把ArrayList想象成体育委员,老师查人数的时候他不可能每个同学都记住名字是不是?但是体育委员都认识你们呀,瞄一眼就知道哪个同学没来是不是?如果老师要查点人数,是不是要一个一个点名再对号。有时候人没点完就下课了。哈哈
至于线程不安全,如上图,ArrayList是非同步的,自然不安全。效率高仅限查询效率。
ArrayList总结:
优点: 底层数据结构是数组,查询快,增删慢。
缺点: 线程不安全,效率高。
1.2、LinkedList
同样:LinkedList也是非同步的,自然也不安全。效率高仅限增删操作。
举个栗子:围绕操场跑步的时候都是体育委员在一侧领着大家跑操场的,如果老师让他归队,不管他站到谁在后面,他后面的同学是不是都要后移一个位置?但是如果他直接去最后一个同学那是不是大家都不要换位置了。OK
LinkedList总结:
优点: 底层数据结构是链表(双向链表),查询慢,增删快。
缺点: 线程不安全,效率高
1.3、Vector
Vector和ArrayList很类似,唯一的区别就是它是同步的且Vector
的大小可以根据需要增长或缩小。同步的线程自然安全。而且同步的一般效率都较低,记住,这里的效率都是相对而言。ArrayList查询效率高,LinkedList增删效率高,没有对比就没有伤害。
这里还要提到一点,数组的扩容,就不在这讲了,感兴趣的同学可以关注后续更新或自行研究。
Vector
总结:
优点: 底层数据结构是数组,查询快,增删慢。
缺点: 线程安全,效率低
ArrayList、LinkedList、Vector对比:
Arraylist和LinkedList区别上文有提到,这里就不多说了。它们的区别一般主要用在遍历数据的查询插入顺序的时候。
而ArrayList和Vector的底层都是用数组实现的。
Arraylist:
优点:ArrayList是实现了基于动态数组的数据结构,查询操作效率较高(体育课还能记得吗哈哈)。
缺点:因为地址连续, ArrayList要移动数据,所以插入和删除操作效率比较低(体育委员插队还插在最前面好烦 = = #)。
LinkedList:
优点:LinkedList基于双向链表的数据结构,地址随机(射气球),增删操作较高。
缺点:因为LinkedList要移动指针,所以查询效率性能较低。
适用场景分析:
当需要对数据进行对此访问的情况下选用ArrayList,当需要对数据进行多次增加删除修改时采用LinkedList。
ArrayList与Vector的区别和适用场景
ArrayList有三个构造方法:
Java代码
public ArrayList(int initialCapacity)//构造一个具有指定初始容量的空列表。
public ArrayList()//构造一个初始容量为10的空列表。
public ArrayList(Collection<? extends E> c)//构造一个包含指定 collection 的元素的列表
Vector有四个构造方法:
Java代码
public Vector()//使用指定的初始容量和等于零的容量增量构造一个空向量。
public Vector(int initialCapacity)//构造一个空向量,使其内部数据数组的大小,其标准容量增量为零。
public Vector(Collection<? extends E> c)//构造一个包含指定 collection 中的元素的向量
public Vector(int initialCapacity,int capacityIncrement)//使用指定的初始容量和容量增量构造一个空的向量
ArrayList和Vector都是用数组实现的,主要有三个区别:
1.Vector是多线程安全的(同步的还记得吗),线程安全就是说多线程访问同一代码,不会产生不确定的结果。而ArrayList不是,这个可以从源码中看出,Vector类中的方法很多有synchronized进行修饰,这样就导致了Vector在效率上无法与ArrayList相比;
2.两个都是采用的线性连续空间存储元素,但是当空间不足的时候,两个类的增加方式是不同。
3.Vector可以设置增长因子,而ArrayList不可以。
4.Vector是一种老的动态数组,是线程同步的,效率很低,一般不赞成使用。
适用场景分析:
1.Vector是线程同步的,所以它也是线程安全的,而ArrayList是线程异步的,是不安全的。如果不考虑到线程的安全因素,一般用ArrayList效率比较高。
2.如果集合中的元素的数目大于目前集合数组的长度时,在集合中使用数据量比较大的数据,用Vector有一定的优势。
2.Set
老规矩先上图:
如图所述:Set集合唯一且无序。再举个栗子吧,希望大家要学会举一反三,相信大家都玩过射气球吧,一圈气球无序排列,我们是不是都是乱射的,只要能打中就有小礼物,而且是每个气球对应的都是不同的礼物是不是。(set 记住射气球就完事了。biubiubiu,,,)
Set下常用的有实现类有HashSet,LinkedHashSet,TreeSet
2.1、HashSet
哈希两个字圈起来,重点,会考,记住凡是和哈希沾边的效率普遍都较高,hash是一个效率很高的封装算法。非同步非线程安全
总结:HashSet
底层数据结构是哈希表。(无序,唯一,记住Set是什么来。射气球。)
如何来保证元素唯一性?
1.依赖两个方法:hashCode()和equals()
2.2、LinkedHashSet
总结:LikedHashSet
底层数据结构:双向链表类似LinkedList 。可重复,无序。(set:射气球。)
1.由链表保证元素有序
2.由哈希表保证元素唯一
2.3、TreeSet
总结:TreeSet(特殊)
底层数据结构是红黑树,(唯一,有序)非同步,非线程安全。
1. 如何保证元素排序的呢?
自然排序
比较器排序
2.如何保证元素唯一性的呢?
根据比较的返回值是否是0来决定
小结:List和Set区别:
2、List特点:元素有放入顺序,元素可重复 ,
Set特点:元素无放入顺序,元素不可重复,重复元素会覆盖掉,(注意:元素虽然无放入顺序,但是元素在set中的位置是有该元素的HashCode决定的,其位置其实是固定的,加入Set 的Object必须定义equals()方法 ,另外list支持for循环,也就是通过下标来遍历,也可以用迭代器,但是set只能用迭代,因为他无序,无法用下标来取得想要的值。)
3.Set和List对比:
Set:检索元素效率低下,删除和插入效率高,插入和删除不会引起元素位置改变。
List:和数组类似,List可以动态增长,查找元素效率高,插入删除元素效率低,因为会引起其他元素位置改变。
HashSet与Treeset的适用场景
1.TreeSet 是二叉树(红黑树的树据结构)实现的,Treeset中的数据是自动排好序的,不允许放入null值
2.HashSet 是哈希表实现的,HashSet中的数据是无序的,可以放入null,但只能放入一个null,两者中的值都不能重复,就如数据库中唯一约束
3.HashSet要求放入的对象必须实现HashCode()方法,放入的对象,是以hashcode码作为标识的,而具有相同内容的String对象,hashcode是一样,所以放入的内容不能重复。但是同一个类的对象可以放入不同的实例
适用场景分析:HashSet是基于Hash算法实现的,其性能通常都优于TreeSet。为快速查找而设计的Set,我们通常都应该使用HashSet,在我们需要排序的功能时,我们才使用TreeSet。
Arraylist和Vector区别:
1、Vector多线程是安全的,而ArrayList不是。Vector类中的方法很多有synchronized进行修饰,这样就导致了Vector在效率上无法与ArrayList相比;
2、两个都是采用的线性连续空间存储元素,但是当空间不足的时候,两个类的增加方式是不同的。
(很多网友说Vector增加原来空间的一倍,ArrayList增加原来空间的50%,其实也差不多是这个意思。)
3、Vector可以设置增长因子,而ArrayList不可以。
4、ArrayList有三个构造方法,Vector有四个构造方法。
5、Vector比Arraylist多一个构造方法,public Vector(int initialCapacity,int capacityIncrement)这个构造方法,capacityIncrement就是容量增长,前面所说的增长因子,ArrayList中是没有的。
6、Vector是同步的,ArrayList非同步,所以效率上ArrayList要比Vector高一些。
没有一个ArrayList的方法具有同步执行的能力;相反,Vector的大多数方法具有同步能力,或直接或间接。
所以,Vector线程安全,ArrayList线程不安全。因此ArrayList要比Vector快速。
应用场景:
在不需要同步时应该使用ArrayList,反之使用Vector。
其实Set和List这2个没可比性,面试很少问到,都是问具体的,但是也不排除有的面试官上来就从底层问起。
List和Set,Map有什么区别?那么如果你看完这篇文章肯定一点不慌,吊打面试官!
那么我们继续Map之旅,
3.Map(映射)
首先Map是独立的,独立与List、Set的抽象类(接口)别晕,说它是抽象类或者接口都行。
相同点上面有提到,都import java.util.XXX
其次Map是一种把键对象和值对象映射的集合,它的每一个元素都包含一对键对象和值对象。 Map是通过“键”来查找“值”
就是使用对象的hashCode()进行快速查询的。此方法能够显着提高性能。
Map没有继承于Collection接口 从Map集合中检索元素时,只要给出键对象,就会返回对应的值对象。
Map接口有三个比较重要的实现类,分别是HashMap、TreeMap和HashTable。
HashMap:
Map基于散列表的实现。插入和查询“键值对”的开销是固定的。可以通过构造器设置容量capacity和负载因子load factor,以调整容器的性能。
HsahTable:
TreeMap :
基于红黑树数据结构的实现。查看“键”或“键值对”时,它们会被排序(次序由Comparabel或Comparator决定)。TreeMap的特点在 于,你得到的结果是经过排序的。TreeMap是唯一的带有subMap()方法的Map,它可以返回一个子树。
LinkedHashMap: 类似于HashMap,但是迭代遍历它时,取得“键值对”的顺序是其插入次序,或者是最近最少使用(LRU)的次序。只比HashMap慢一点。而在迭代访问时发而更快,因为它使用链表维护内部次序。
WeakHashMao :弱键(weak key)Map,Map中使用的对象也被允许释放: 这是为解决特殊问题设计的。如果没有map之外的引用指向某个“键”,则此“键”可以被垃圾收集器回收。
IdentifyHashMap: : 使用==代替equals()对“键”作比较的hash map。专为解决特殊问题而设计。
TreeMap是有序的,HashMap和HashTable是无序的。
Hashtable的方法是同步的,HashMap的方法不是同步的。这是两者最主要的区别。
这就意味着:
Hashtable是线程安全的,HashMap不是线程安全的。
HashMap效率较高,Hashtable效率较低。
如果对同步性或与遗留代码的兼容性没有任何要求,建议使用HashMap。 查看Hashtable的源代码就可以发现,除构造函数外,Hashtable的所有 public 方法声明中都有 synchronized关键字,而HashMap的源码中则没有。
Hashtable不允许null值,HashMap允许null值(key和value都允许)
父类不同:Hashtable的父类是Dictionary,HashMap的父类是AbstractMap
应用场景总结:
1. 如果涉及到堆栈,队列等操作,应该考虑用List,对于需要快速插入,删除元素,应该使用LinkedList,如果需要快速随机访问元素,应该使用ArrayList。
2. 如果程序在单线程环境中,或者访问仅仅在一个线程中进行,考虑非同步的类,其效率较高,如果多个线程可能同时操作一个类,应该使用同步的类。
3. 在除需要排序时使用TreeSet,TreeMap外,都应使用HashSet,HashMap,因为他们的效率更高。
4. 要特别注意对哈希表的操作,作为key的对象要正确复写equals和hashCode方法。
5. 容器类仅能持有对象引用(指向对象的指针),而不是将对象信息copy一份至数列某位置。一旦将对象置入容器内,便损失了该对象的型别信息。
6. 尽量返回接口而非实际的类型,如返回List而非ArrayList,这样如果以后需要将ArrayList换成LinkedList时,客户端代码不用改变。这就是针对抽象编程。
注意:
1、Collection没有get()方法来取得某个元素。只能通过iterator()遍历元素。
2、Set和Collection拥有一模一样的接口。
3、List,可以通过get()方法来一次取出一个元素。使用数字来选择一堆对象中的一个,get(0)...。(add/get)
4、一般使用ArrayList。用LinkedList构造堆栈stack、队列queue。
5、Map用 put(k,v) / get(k),还可以使用containsKey()/containsValue()来检查其中是否含有某个key/value。
HashMap会利用对象的hashCode来快速找到key。
6、Map中元素,可以将key序列、value序列单独抽取出来。
使用keySet()抽取key序列,将map中的所有keys生成一个Set。
使用values()抽取value序列,将map中的所有values生成一个Collection。
为什么一个生成Set,一个生成Collection?那是因为,key总是独一无二的,value允许重复。
HashMap和HashTable:HashMap去掉了HashTable的contains方法,但是加上了containsValue()和containsKey()方法。HashTable同步的,而HashMap是非同步的,效率上比HashTable要高。HashMap允许空键值,而HashTable不允许。
HashMap:适用于Map中插入、删除和定位元素。
Treemap:适用于按自然顺序或自定义顺序遍历键(key)。
扩展:Collection和Collections的区别?
7.线程安全集合类与非线程安全集合类对比
LinkedList、ArrayList、HashSet是非线程安全的,Vector是线程安全的;
HashMap是非线程安全的,HashTable是线程安全的;
StringBuilder是非线程安全的,StringBuffer是线程安全的。