概览
集合类放在java.util包中,主要有3种: set, list,map
- Collection : 是List, Set, Queue的最基本的接口
- Iterator: 迭代器, 可通过迭代器遍历集合中的数据
- Map : 是映射表的基础结构
Collections
Collection:
|–List:有序(元素存入集合的顺序和取出的顺序一致),元素都有索引。元素可以重复。
|–Set:无序(存入和取出顺序有可能不一致),不可以存储重复元素。必须保证元素唯一性。
1,添加:
add(object):添加一个元素
addAll(Collection) :添加一个集合中的所有元素。
2,删除:
clear():将集合中的元素全删除,清空集合。
remove(obj) :删除集合中指定的对象。注意:删除成功,集合的长度会改变。
removeAll(collection) :删除部分元素。部分元素和传入Collection一致。
3,判断:
boolean contains(obj) :集合中是否包含指定元素 。
boolean containsAll(Collection) :集合中是否包含指定的多个元素。
boolean isEmpty():集合中是否有元素。
4,获取:
int size():集合中有几个元素。
5,取交集:
boolean retainAll(Collection) :对当前集合中保留和指定集合中的相同的元素。如果两个集合元素相同,返回flase;如果retainAll修改了当前集合,返回true。
6,获取集合中所有元素:
Iterator iterator():迭代器
7,将集合变成数组:
toArray();
List
List:有序(元素存入集合的顺序和取出的顺序一致),元素都有索引。元素可以重复。
|–ArrayList:底层的数据结构是数组,线程不同步,ArrayList替代了Vector,查询元素的速度非常快。
|–LinkedList:底层的数据结构是链表,线程不同步,增删元素的速度非常快。
|–Vector:底层的数据结构就是数组,线程同步的,Vector无论查询和增删都巨慢。
ArrayList
3种遍历方式
- 传统for循环
for(int i =0; i< aList.size(); i++){
Sytem.out.println(aList.get(i))
}
-
高级for循环
//for (数据类型 变量名:集合/数组) for(Object temp:aList){ System.out.println(temp) }
-
lambda表达式
//集合.forEach(temp->{代码块}); Alist.forEach(temp -> { System.out.println(temp) })
泛型
泛型就是参数化类型
- 适用于多种数据类型执行相同的代码
- 泛型中的类型在使用时指定
- 泛型归根到底就是“模版”
Set
Set接口中的方法和Collection中方法一致的。Set接口取出方式只有一种,迭代器。
|–HashSet:底层数据结构是哈希表,线程是不同步的。无序,高效;
HashSet集合保证元素唯一性:通过元素的hashCode方法,和equals方法完成的。
当元素的hashCode值相同时,才继续判断元素的equals是否为true。
如果为true,那么视为相同元素,不存。如果为false,那么存储。
如果hashCode值不同,那么不判断equals,从而提高对象比较的速度。
|–LinkedHashSet:有序,hashset的子类。
|–TreeSet:对Set集合中的元素的进行指定顺序的排序。不同步。TreeSet底层的数据结构就是二叉树。
对Set的选择
- HashSet由于使用HashCode来实现,所有某种程度上来说它的性能永远比TreeSet要好,尤其是进行增加和查询操作。
- 虽然TreeSet没有HashSet性能好,但是由于它可以维持元素的排序,所以还是会有它的应用场景在的。
- EnumSet只能存储Enum,所以只会在存储Enum的情况下使用。
初始容量是16, 加载因子是0.75 (+ 16*0.75 = 12)
HashSet
底层是哈希表,无序,不可重复
HashSet按Hash算法来存取 查找集合中的元素
- HashSet具有很好的存取 查找的性能 从HashSet中查找某个对象时,首先调用对象的hashCode方法获取该对象的哈希码,然后根据哈希码找到相应的存储区域,最后取出该存储区域的每个元素与该元素进行equals方法比较,这样就不用遍历集合中所有元素就能查找到结果。
- HashSet不是同步的 也就是线程不安全,如果多个线程访问同一个Set集合,如果有2条或者2条以上线程同时修改了HashSet集合时,必须使用代码来保证其同步
- 元素值可以是null
- 不能保证元素的排列顺序,顺序有可能发生变化
哈希表的原理
1,对对象元素中的关键字(对象中的特有数据),进行哈希算法的运算,并得出一个具体的算法值,这个值 称为哈希值。
2,哈希值就是这个元素的位置。
3,如果哈希值出现冲突,再次判断这个关键字对应的对象是否相同。如果对象相同,就不存储,因为元素重复。如果对象不同,就存储,在原来对象的哈希值基础 +1顺延。
4,存储哈希值的结构,我们称为哈希表。
5,既然哈希表是根据哈希值存储的,为了提高效率,最好保证对象的关键字是唯一的。
这样可以尽量少的判断关键字对应的对象是否相同,提高了哈希表的操作效率。
对于ArrayList集合,判断元素是否存在,或者删元素底层依据都是equals方法。
对于HashSet集合,判断元素是否存在,或者删除元素,底层依据的是hashCode方法和equals方法。
TreeSet
底层是二叉树,不可重复,但是有序(对于实现了Comparable,Comparator接口的类型)
Map
Map集合:
|–Hashtable:底层是哈希表数据结构,是线程同步的。不可以存储null键,null值。
|–HashMap:底层是哈希表数据结构,是线程不同步的。可以存储null键,null值。替代了Hashtable.
|–TreeMap:底层是二叉树结构,可以对map集合中的键进行指定顺序的排序。
Map集合存储和Collection有着很大不同:
Collection一次存一个元素;Map一次存一对元素。
Collection是单列集合;Map是双列集合。
Map中的存储的一对元素:一个是键,一个是值,键与值之间有对应(映射)关系。
特点:要保证map集合中键的唯一性。
1,添加。
put(key,value):当存储的键相同时,新的值会替换老的值,并将老值返回。如果键没有重复,返回null。
void putAll(Map);
2,删除。
void clear():清空
value remove(key) :删除指定键。
3,判断。
boolean isEmpty():
boolean containsKey(key):是否包含key
boolean containsValue(value) :是否包含value
4,取出。
int size():返回长度
value get(key) :通过指定键获取对应的值。如果返回null,可以判断该键不存在。当然有特殊情况,就是在hashmap集合中,是可以存储null键null值的。
Collection values():获取map集合中的所有的值。
5,想要获取map中的所有元素:
原理:map中是没有迭代器的,collection具备迭代器,只要将map集合转成Set集合,可以使用迭代器了。之所以转成set,是因为map集合具备着键的唯一性,其实set集合就来自于map,set集合底层其实用的就是map的方法。
参考
毕向东视频