Set接口
Set不允许包含相同的元素。
Set是无序的,不能重复的,所有Set是没有get()方法的,因此不能使用常规的for循环遍历的
Set判断两个对象相同不是使用==运算符,而是根据equals方法。也就是说,只要两个对象用equals方法比较返回true,Set就不 会接受这两个对象。
HashSet是无序,且不能重复的,因为使用是Hash表实现。
TreeSet排好序的集合,因为底层是一个二叉树。
LinkedHashSet:有序(按添加的先后顺序),不能重复的。
HashSet的存储的原理:底层是使用HashMap存储,真正的值,是存储在Map的kay中,值随机创建一个对象(new Object)。
HashSet底层实质是一个HashMap在云行,数据存储在Map的Key中。
HashSet去重原理:
1、判断这个值的hashcode值,如果两个值的hashcode不相等,肯定不是同一个值。
2、如果hascode相等,进入第二个判断,调用equale方法判断,如果返回true,则肯定是同一个的对象,如果返回false,则说明这两个对象不相同(重点)。
在TreeSet中,所有的数据是存储在一个二叉树上,所以数据是有序的(已经排好序的)。
TreeSet支持自然顺序访问,但是添加、删除、包含等操作要相对低效时间。
LinkedHashSet,内部构建了一个记录插入顺序的双向链表,因此提供了按照插入顺序遍历的能力,与此同时,也保证了常数时间的添加、删除、包含等操作,这些操作性能略低于HashSet,因为需要维护链表的开销。
如果需要比较自定义的一些对象,此时重写equals和hashcode方法!
自定义类型需要排序:一定要要实现Comparable接口,规定了排序的规则。
三种遍历方式
1、利用Collection接口提供的API,先将集合转换为数组,在遍历
这儿使用Set的子类是基于Hash表实现的,无序和不能重复的主要原因是因为Hash表。
2、第二种方式:foreach,也据说for循环加强
3、第三种方式、使用迭代器