Set接口存储无序的、不可重复的数据
存储无序性:无序不等于随机。存储的数据在底层数组中并非是按照数组索引的顺序添加,而实根据数据的hash值存放
不可重复性:保证添加的元素按照equals()判断时,不能返回true。即相同的元素只能有一个
HashSet无参构造函数源码:
/**
* Constructs a new, empty set; the backing <tt>HashMap</tt> instance has
* default initial capacity (16) and load factor (0.75).
* 构造一个新的、空的set集合;后台HashMap实例具有默认的初始容量(16)和装载因子(0.75)。
*/
public HashSet() {
map = new HashMap<>();
}
添加元素的过程:HashSet为例
向HashSet中添加元素a,首先调用元素a所在类的hashCode()方法,计算元素a的哈希值,
此哈希值接着通过某种算法计算出在HashSet底层数组中的存放位置(即索引位置),
一、判断数组此位置上是否已有其他元素:
1、如果此位置上没有其他元素,则元素a添加成功;
2、如果此位置上有其他元素b(或以链表形式存在多个元素),则比较元素a与b的hash值:
(1)如果hash值不同,则添加成功;
(2)如果hash值相同,进而需要调用元素a所在类的equals()方法:
1)equals()返回true,元素a添加失败;
2)反之成功。
对于添加成功的(1)和2)两种情况:元素a与已经存在指定索引位置上的数据以链表的方式存储
jdk7:元素a放到数组中,指向原来的元素;
jdk8:原来的元素放在数组中,指向元素a。
HashSet底层是数组 + 链表;
初始容量为16,当使用率超过0.75(16 * 0.75 = 12),扩容为原来的2倍(32,64,。。。)
注意:
- 向Set中添加的数据,其所在的类一定要重写hashCode()和equals()方法,
- 以实现对象相等规则,即“相等的对象必须具有相等的散列码”