JAVA学习总结之Set集合

Set集合:
    三个实现类HashSet、TreeSet、EnumSet

注:Set不允许包含相同元素

一、HashSet特点:

    1.不能保证元素的排列顺序;

    2.HashSet不是同步的;

    3.集合元素可以是null。

HashSet中判断两个元素是否相等:

    1.要通过equals()方法比较相等;

    2.要两个对象的hashCode()方法的返回值也相等。

注意:
    当把一个对象放入HashSet中时,如果需要重写该对象对应类的equals()方法,则也应该重写hashCode()方法。

    规则是:如果两个对象通过equals()方法比较返回true,则这两个对象的hashCode值也应该相同。

    
HashSet和数组比较:
    
    * 数组:可以包含多个元素,每个元素都有索引,通过索引访问元素,长度固定,无法自由增加数组的长度;

        数组是所有能存储一组元素里最快的数据结构。

    * HashSet:  采用hashCode值来计算其存储位置,从而可以自由增加HashSet的长度,并可以根据元素的hashSet值来访问元素。

    (因此当从HashSet访问元素时,HashSet先调用hashSet()方法返回hashCode值,然后直接到hashCode值对应的位置去取出该元素--这就是HashSet速度很快的原因。)

注意:当向HashSet中添加可变元素时,必须十分小心。如果修改HashSet中的对象,有可能导致该对象与集合中的其他对相等,从而导致HashSet无法准确访问该对象。

二、HashSet的子类LinkedHashSet类

LinkedHashSet:
    1.需要维护元素的插入顺序(因此性能略低于HashSet的性能);

    2.在迭代访问Set里的元素时将有很好的性能(因为它以链表来维护内部顺序)。

注意:虽然LinkedHashSet使用了链表记录集合元素的添加顺序,但LinkedHashSet依然是HashSet,因此它依然不允许集合元素重复。

补充一下链表的知识:

    链表全称:线性表的链式存储结构(最常用的存储方式之一,它不仅可以用来表示线性表,还可以用来表示各种非线性的数据结构)

    特点:

    1.用一组任意的存储单元来存放线性表的节点(这组存储单元既可以是连续的,也可以是不连续的);

    2.链表中节点的逻辑此项和物理次序不一定相同。

链表可以采用静态链表和动态链表两种物理结构形式存储。可以用数组来存储元素的值和地址。
    
    1.静态链表:在程序运算过程中,数组元素个数固定不变,故称这种链表为静态链表。
    
    如定义物流配送的收件人信息

    (1)定义顾客信息数据类型
    
    typedef struct
    {
        char number[7];    /*序号*/
        char id[10];    /*配送编号*/
        char name[10];    /*姓名*/
        char addr[20];    /*地址*/
    }ElemType;

    (2)定义节点类型

    typedef struct node
    {
        ElemType date;    /*数据域*/
        int next;    /*指针域*/
    }SLNode;
    
    (3)定义静态单链表

    SLNode letter[100]

    2.动态链表:线性表元素个数不确定,根据实际问题的需要临时、动态的分配存储空间的链表。

    typedef struct
    {
        char number[7];    /*序号*/
        char id[10];    /*配送编号*/
        char name[10];    /*姓名*/
        char addr[20];    /*地址*/
    }ElemType;

    (2)定义链表及节点类型

    typedef struct node
    {
        ElemType date;        /*数据域*/
        struct node *next;    /*指针域*/
    }LNode,*LinkList;
    
三、TreeSet类

TreeSet:SortedSet接口的实现类,正如Sorted名字所暗示的,TreeSet可以确保集合元素处于排序状态

注意:并不是根据元素的插入顺序进行排序,而是根据元素实际值得大小排序的。

    与HashSet集合相比,TreeSet增加了访问集合第一个、前一个、后一个、最后一个元素的方法,并且提高了三个从TreeSet中截取子类的方法

    即Sorted.headSet(Object toEnlement)截取小于指定元素的子类(不包含指定元素);

    Sorted.taildSet(Object fromElement)截取大于指定元素的子类(包含指定元素);

    Sorted.subSet(fromElement, toElement)截取大于等于指定元素a,小于指定元素b的子类的方法。

比较:
    与HashSet集合采用hash算法来决定元素的存储位置不同,TreeSet采用红黑树的数据结构来存储集合元素。

TreeSet支持两种排序方法:自然排序和定制排序。在默认情况下,TreeSet采用自然排序。

注意;
    如果要把一个对象添加到TreeSet中,则该对象的类必须实现Comparable接口,否则程序将会抛出异常。

    并且如果希望TreeSet能正常运作,TreeSet只能添加同一类型的对象(因为涉及到Comparable接口中的comparaTor(Object obj)方法)

四、EnumSet:
    
    1.以枚举值在Enum类的定义顺序来绝点元素的顺序.

    2.在内部以位向量的形式存储,这种形式非常紧凑高效,因此EnumSet对象占用内存小,运行效率很好,尤其是批操作.

    3.EnumSet不允许加入空null元素.

注意:当复制Collection集合中的所有元素来创建新的EnumSet集合时,要求Collection集合中的所有元素必须是同一枚举类的枚举值.

各Set的性能比较:

    HashSet的性能总是比TreeSet好(特别是最常用的添、查询等操作),因为TreeSet需要额外的红黑树算法来维护集合元素的次序.只有当需要一个保持排序的Set时,才应该使用TreeSet,否则都应该使用HashSet.

    HashSet的子类LinkedSet,对于普通的插入、删除等操作比HashSet要略微慢一点,这是由维护链表所带来的额外开销造成的,但由于有了链表,遍历LinkedSet会更快.

    EnumSet是所有Set实现类中性能最好的,但它只能保存同一个枚举类的枚举值作为集合元素.

    Set集合的三个实现类HashSet、TreeSet、EnumSet都是线程不安全的.如果有多个线程同时访问一个Set集合,并且有超过一个线程修改了该集合,则必须手动保证该Set集合的同步性.

    通常可以通过Collection工具类的syschronizedSortedSet方法来"包装"该集合,次操作最好在创建时进行,以防止对Set集合的意外非同步访问.


    

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值