Set集合:
三个实现类HashSet、TreeSet、EnumSet
注:Set不允许包含相同元素
一、HashSet特点:
1.不能保证元素的排列顺序;
2.HashSet不是同步的;
3.集合元素可以是null。
HashSet中判断两个元素是否相等:
1.要通过equals()方法比较相等;
2.要两个对象的hashCode()方法的返回值也相等。
注意:
当把一个对象放入HashSet中时,如果需要重写该对象对应类的equals()方法,则也应该重写hashCode()方法。
规则是:如果两个对象通过equals()方法比较返回true,则这两个对象的hashCode值也应该相同。
HashSet和数组比较:
* 数组:可以包含多个元素,每个元素都有索引,通过索引访问元素,长度固定,无法自由增加数组的长度;
数组是所有能存储一组元素里最快的数据结构。
* HashSet: 采用hashCode值来计算其存储位置,从而可以自由增加HashSet的长度,并可以根据元素的hashSet值来访问元素。
(因此当从HashSet访问元素时,HashSet先调用hashSet()方法返回hashCode值,然后直接到hashCode值对应的位置去取出该元素--这就是HashSet速度很快的原因。)
注意:当向HashSet中添加可变元素时,必须十分小心。如果修改HashSet中的对象,有可能导致该对象与集合中的其他对相等,从而导致HashSet无法准确访问该对象。
二、HashSet的子类LinkedHashSet类
LinkedHashSet:
1.需要维护元素的插入顺序(因此性能略低于HashSet的性能);
2.在迭代访问Set里的元素时将有很好的性能(因为它以链表来维护内部顺序)。
注意:虽然LinkedHashSet使用了链表记录集合元素的添加顺序,但LinkedHashSet依然是HashSet,因此它依然不允许集合元素重复。
补充一下链表的知识:
链表全称:线性表的链式存储结构(最常用的存储方式之一,它不仅可以用来表示线性表,还可以用来表示各种非线性的数据结构)
特点:
1.用一组任意的存储单元来存放线性表的节点(这组存储单元既可以是连续的,也可以是不连续的);
2.链表中节点的逻辑此项和物理次序不一定相同。
链表可以采用静态链表和动态链表两种物理结构形式存储。可以用数组来存储元素的值和地址。
1.静态链表:在程序运算过程中,数组元素个数固定不变,故称这种链表为静态链表。
如定义物流配送的收件人信息
(1)定义顾客信息数据类型
typedef struct
{
char number[7]; /*序号*/
char id[10]; /*配送编号*/
char name[10]; /*姓名*/
char addr[20]; /*地址*/
}ElemType;
(2)定义节点类型
typedef struct node
{
ElemType date; /*数据域*/
int next; /*指针域*/
}SLNode;
(3)定义静态单链表
SLNode letter[100]
2.动态链表:线性表元素个数不确定,根据实际问题的需要临时、动态的分配存储空间的链表。
typedef struct
{
char number[7]; /*序号*/
char id[10]; /*配送编号*/
char name[10]; /*姓名*/
char addr[20]; /*地址*/
}ElemType;
(2)定义链表及节点类型
typedef struct node
{
ElemType date; /*数据域*/
struct node *next; /*指针域*/
}LNode,*LinkList;
三、TreeSet类
TreeSet:SortedSet接口的实现类,正如Sorted名字所暗示的,TreeSet可以确保集合元素处于排序状态
注意:并不是根据元素的插入顺序进行排序,而是根据元素实际值得大小排序的。
与HashSet集合相比,TreeSet增加了访问集合第一个、前一个、后一个、最后一个元素的方法,并且提高了三个从TreeSet中截取子类的方法
即Sorted.headSet(Object toEnlement)截取小于指定元素的子类(不包含指定元素);
Sorted.taildSet(Object fromElement)截取大于指定元素的子类(包含指定元素);
Sorted.subSet(fromElement, toElement)截取大于等于指定元素a,小于指定元素b的子类的方法。
比较:
与HashSet集合采用hash算法来决定元素的存储位置不同,TreeSet采用红黑树的数据结构来存储集合元素。
TreeSet支持两种排序方法:自然排序和定制排序。在默认情况下,TreeSet采用自然排序。
注意;
如果要把一个对象添加到TreeSet中,则该对象的类必须实现Comparable接口,否则程序将会抛出异常。
并且如果希望TreeSet能正常运作,TreeSet只能添加同一类型的对象(因为涉及到Comparable接口中的comparaTor(Object obj)方法)
四、EnumSet:
1.以枚举值在Enum类的定义顺序来绝点元素的顺序.
2.在内部以位向量的形式存储,这种形式非常紧凑高效,因此EnumSet对象占用内存小,运行效率很好,尤其是批操作.
3.EnumSet不允许加入空null元素.
注意:当复制Collection集合中的所有元素来创建新的EnumSet集合时,要求Collection集合中的所有元素必须是同一枚举类的枚举值.
各Set的性能比较:
HashSet的性能总是比TreeSet好(特别是最常用的添、查询等操作),因为TreeSet需要额外的红黑树算法来维护集合元素的次序.只有当需要一个保持排序的Set时,才应该使用TreeSet,否则都应该使用HashSet.
HashSet的子类LinkedSet,对于普通的插入、删除等操作比HashSet要略微慢一点,这是由维护链表所带来的额外开销造成的,但由于有了链表,遍历LinkedSet会更快.
EnumSet是所有Set实现类中性能最好的,但它只能保存同一个枚举类的枚举值作为集合元素.
Set集合的三个实现类HashSet、TreeSet、EnumSet都是线程不安全的.如果有多个线程同时访问一个Set集合,并且有超过一个线程修改了该集合,则必须手动保证该Set集合的同步性.
通常可以通过Collection工具类的syschronizedSortedSet方法来"包装"该集合,次操作最好在创建时进行,以防止对Set集合的意外非同步访问.
三个实现类HashSet、TreeSet、EnumSet
注:Set不允许包含相同元素
一、HashSet特点:
1.不能保证元素的排列顺序;
2.HashSet不是同步的;
3.集合元素可以是null。
HashSet中判断两个元素是否相等:
1.要通过equals()方法比较相等;
2.要两个对象的hashCode()方法的返回值也相等。
注意:
当把一个对象放入HashSet中时,如果需要重写该对象对应类的equals()方法,则也应该重写hashCode()方法。
规则是:如果两个对象通过equals()方法比较返回true,则这两个对象的hashCode值也应该相同。
HashSet和数组比较:
* 数组:可以包含多个元素,每个元素都有索引,通过索引访问元素,长度固定,无法自由增加数组的长度;
数组是所有能存储一组元素里最快的数据结构。
* HashSet: 采用hashCode值来计算其存储位置,从而可以自由增加HashSet的长度,并可以根据元素的hashSet值来访问元素。
(因此当从HashSet访问元素时,HashSet先调用hashSet()方法返回hashCode值,然后直接到hashCode值对应的位置去取出该元素--这就是HashSet速度很快的原因。)
注意:当向HashSet中添加可变元素时,必须十分小心。如果修改HashSet中的对象,有可能导致该对象与集合中的其他对相等,从而导致HashSet无法准确访问该对象。
二、HashSet的子类LinkedHashSet类
LinkedHashSet:
1.需要维护元素的插入顺序(因此性能略低于HashSet的性能);
2.在迭代访问Set里的元素时将有很好的性能(因为它以链表来维护内部顺序)。
注意:虽然LinkedHashSet使用了链表记录集合元素的添加顺序,但LinkedHashSet依然是HashSet,因此它依然不允许集合元素重复。
补充一下链表的知识:
链表全称:线性表的链式存储结构(最常用的存储方式之一,它不仅可以用来表示线性表,还可以用来表示各种非线性的数据结构)
特点:
1.用一组任意的存储单元来存放线性表的节点(这组存储单元既可以是连续的,也可以是不连续的);
2.链表中节点的逻辑此项和物理次序不一定相同。
链表可以采用静态链表和动态链表两种物理结构形式存储。可以用数组来存储元素的值和地址。
1.静态链表:在程序运算过程中,数组元素个数固定不变,故称这种链表为静态链表。
如定义物流配送的收件人信息
(1)定义顾客信息数据类型
typedef struct
{
char number[7]; /*序号*/
char id[10]; /*配送编号*/
char name[10]; /*姓名*/
char addr[20]; /*地址*/
}ElemType;
(2)定义节点类型
typedef struct node
{
ElemType date; /*数据域*/
int next; /*指针域*/
}SLNode;
(3)定义静态单链表
SLNode letter[100]
2.动态链表:线性表元素个数不确定,根据实际问题的需要临时、动态的分配存储空间的链表。
typedef struct
{
char number[7]; /*序号*/
char id[10]; /*配送编号*/
char name[10]; /*姓名*/
char addr[20]; /*地址*/
}ElemType;
(2)定义链表及节点类型
typedef struct node
{
ElemType date; /*数据域*/
struct node *next; /*指针域*/
}LNode,*LinkList;
三、TreeSet类
TreeSet:SortedSet接口的实现类,正如Sorted名字所暗示的,TreeSet可以确保集合元素处于排序状态
注意:并不是根据元素的插入顺序进行排序,而是根据元素实际值得大小排序的。
与HashSet集合相比,TreeSet增加了访问集合第一个、前一个、后一个、最后一个元素的方法,并且提高了三个从TreeSet中截取子类的方法
即Sorted.headSet(Object toEnlement)截取小于指定元素的子类(不包含指定元素);
Sorted.taildSet(Object fromElement)截取大于指定元素的子类(包含指定元素);
Sorted.subSet(fromElement, toElement)截取大于等于指定元素a,小于指定元素b的子类的方法。
比较:
与HashSet集合采用hash算法来决定元素的存储位置不同,TreeSet采用红黑树的数据结构来存储集合元素。
TreeSet支持两种排序方法:自然排序和定制排序。在默认情况下,TreeSet采用自然排序。
注意;
如果要把一个对象添加到TreeSet中,则该对象的类必须实现Comparable接口,否则程序将会抛出异常。
并且如果希望TreeSet能正常运作,TreeSet只能添加同一类型的对象(因为涉及到Comparable接口中的comparaTor(Object obj)方法)
四、EnumSet:
1.以枚举值在Enum类的定义顺序来绝点元素的顺序.
2.在内部以位向量的形式存储,这种形式非常紧凑高效,因此EnumSet对象占用内存小,运行效率很好,尤其是批操作.
3.EnumSet不允许加入空null元素.
注意:当复制Collection集合中的所有元素来创建新的EnumSet集合时,要求Collection集合中的所有元素必须是同一枚举类的枚举值.
各Set的性能比较:
HashSet的性能总是比TreeSet好(特别是最常用的添、查询等操作),因为TreeSet需要额外的红黑树算法来维护集合元素的次序.只有当需要一个保持排序的Set时,才应该使用TreeSet,否则都应该使用HashSet.
HashSet的子类LinkedSet,对于普通的插入、删除等操作比HashSet要略微慢一点,这是由维护链表所带来的额外开销造成的,但由于有了链表,遍历LinkedSet会更快.
EnumSet是所有Set实现类中性能最好的,但它只能保存同一个枚举类的枚举值作为集合元素.
Set集合的三个实现类HashSet、TreeSet、EnumSet都是线程不安全的.如果有多个线程同时访问一个Set集合,并且有超过一个线程修改了该集合,则必须手动保证该Set集合的同步性.
通常可以通过Collection工具类的syschronizedSortedSet方法来"包装"该集合,次操作最好在创建时进行,以防止对Set集合的意外非同步访问.