java面试之集合

本文深入解析Java集合框架,包括集合与数组的区别,Collection与Map的特性,HashMap、Hashtable与LinkedHashMap的工作原理及区别,以及TreeSet、HashSet和LinkedHashSet的特性和使用场景。探讨了equals与hashcode的关系,ArrayList与LinkedList的性能对比,和TreeSet的排序机制。

1.什么是集合?它和数组有什么区别?

(1)集合的由来?
   我们学习的是Java -- 面向对象 -- 操作很多对象 -- 存储 -- 容器(数组和StringBuffer) -- 数组
   而数组的长度固定,所以不适合做变化的需求,Java就提供了集合供我们使用。
(2)集合和数组的区别?
   A:长度区别
      数组固定
      集合可变
   B:内容区别
      数组可以是基本类型,也可以是引用类型
      集合只能是引用类型
   C:元素内容
      数组只能存储同一种类型
      集合可以存储不同类型(其实集合一般存储的也是同一种类型)

2.Collection和Map的区别

collection接口:是所有单列集合中共性的方法,因为list有索引,set无索引,所以collection中没有带索引的方法
由于需求不同,Java就提供了不同的集合类。这多个集合类的数据结构不同,但是它们都是要提供存储和遍历功能的,
我们把它们的共性不断的向上提取,最终就形成了集合的继承体系结构图。

Collection
   |--List
      |--ArrayList
      |--Vector
      |--LinkedList
   |--Set
      |--HashSet
      |--TreeSet
Map
   (1)将键映射到值的对象。一个映射不能包含重复的键;每个键最多只能映射到一个值。
   (2)Map和Collection的区别?
      A:Map 存储的是键值对形式的元素,键唯一,值可以重复。夫妻对
      B:Collection 存储的是单独出现的元素,子接口Set元素唯一,子接口List元素可重复。光棍

3.HashMap和Hashtable和LinkedHashMap的区别

hashmap是一个无序的集合
hashtable是一个无序的集合
linkedhashmap是一个有序的集合
HashMap底层的数据结构是哈希表,哈希表是一种优秀的数据结构,它集成了数组的查询快和链表的增删快的特点.
为什么这么说?因为它可以理解为是一个元素为链表的数组.

HashMap的初始桶(数组的大小)的数量为16,loadFact(加载因子)为0.75,当桶里面的数据记录超过阈值(16*0.75)的时候,HashMap将会进行扩容则操作,每次都会变为原来大小的2倍,把所有元素rehash再放到扩容后的容器中,这是一个非常耗时的操作。直到设定的最大值之后就无法再resize(改变大小)了。为什么加载因子要默认是0.75?这就是算法概率统计学的事情了,关键字:泊淞分布,用0.75作为加载因子,每个桶(数组中的一个元素)中元素到达8个时候的概率 0.00000006(官方统计),也就是说用0.75作为加载因子,每个碰撞位置的链表长度超过8个是几乎不可能的。
如果put一个值(key,value)进来,会先对key进行hash运算,得到一个hashcode,hashcode根据算法,插入到数组中.当然,如果两个值是一样的hashcode,那么它们最后得到的插入脚标,是一样的,这种情况称为哈希冲突,解决哈希冲突有开放定址法,再哈希法,建立一个公共溢出区,链地址法等等,而HashMap解决哈希冲突就是用了链地址法,即发生了冲突会再比较其中的内容是否一致,也就是用equals()方法,如果内容一致,那么后者覆盖前者,如果内容不一致,那么后者成为前者的next节点,组成链表,
性能:
    简单来说,HashMap由数组+链表组成的,数组是HashMap的主体,链表则是主要为了解决哈希冲突而存在的,如果定位到的数组位置不含链表(当前entry的next指向null),那么对于查找,添加等操作很快,仅需一次寻址即可;如果定位到的数组包含链表,对于添加操作,其时间复杂度为O(n),首先遍历链表,存在即覆盖,否则新增;对于查找操作来讲,仍需遍历链表,然后通过key对象的equals方法逐一比对查找。所以,性能考虑,HashMap中的链表出现越少,性能才会越好。当桶中的节点数大于8时,桶结构由单链表转化为一个红黑树结构
区别

1、HashMap是继承自AbstractMap类,而HashTable是继承自Dictionary类。不过它们都实现了同时实现了map、Cloneable(可复制)、Serializable(可序列化)这三个接口。
2、HashMap的key-value支持key-value,null-null,key-null,null-value四种。而Hashtable只支持key-value一种(即key和value都不为null这种形式)。既然HashMap支持带有null的形式,那么在HashMap中不能由get()方法来判断HashMap中是否存在某个键,而应该用containsKey()方法来判断,因为使用get的时候,当返回null时,你无法判断到底是不存在这个key,还是这个key就是null,还是key存在但value是null。
3、线程安全性不同,HashMap的方法都没有使用synchronized关键字修饰,都是非线程安全的,而Hashtable的方法几乎都是被synchronized关键字修饰的。HashTable类是线程安全的,它使用synchronize来做线程安全,全局只有一把锁,在线程竞争比较激烈的情况下hashtable的效率是比较低下的。因为当一个线程访问hashtable的同步方法时,其他线程再次尝试访问的时候,会进入阻塞或者轮询状态,比如当线程1使用put进行元素添加的时候,线程2不但不能使用put来添加元素,而且不能使用get获取元素。所以,竞争会越来越激烈。但是,当我们需要HashMap是线程安全的时,怎么办呢?我们可以通过Collections.synchronizedMap(hashMap)来进行处理,亦或者我们使用线程安全的ConcurrentHashMap。ConcurrentHashMap虽然也是线程安全的,但是它的效率比Hashtable要高好多倍。ConcurrentHashMap使用了分段锁技术来提高了并发度,不在同一段的数据互相不影响,多个线程对多个不同的段的操作是不会相互影响的。每个段使用一把锁。所以在需要线程安全的业务场景下,推荐使用ConcurrentHashMap,而HashTable不建议在新的代码中使用,如果需要线程安全,则使用ConcurrentHashMap,否则使用HashMap就足够了。
4、HashMap去掉了Hashtable的contains(Object value)方法,保留containsKey和containsValue方法。

参考:

https://blog.youkuaiyun.com/weixin_40255793/article/details/80748946

https://www.jianshu.com/p/8f4f58b4b8ab

https://www.jianshu.com/p/e2f75c8cce01

https://blog.youkuaiyun.com/luojishan1/article/details/81952147

4.为什么重写equals方法就必须重写hashcode方法

趁热打铁
先说规定
    1. 如果两个对象相同(即用equals比较返回true),那么它们的hashCode值一定要相同!!!!;
    2. 如果两个对象不同(即用equals比较返回true),那么它们的hashCode值可能相同也可能不同;
    3. 如果两个对象的hashCode相同(存在哈希冲突),那么它们可能相同也可能不同(即equals比较可能是false也可能是true)
    4. 如果两个对象的hashCode不同,那么他们肯定不同(即用equals比较返回false)
    也就是说如果equals相同,hashcode一定也要相同,这是规定,如果不遵循,就会产生误解和矛盾
对于对象集合的判重,如果一个集合含有10000个对象实例,仅仅使用equals()方法的话,那么对于一个对象判重就需要比较10000次,随着集合规模的增大,时间开销是很大的。但是同时使用哈希表的话,就能快速定位到对象的大概存储位置,并且在定位到大概存储位置后,后续比较过程中,如果两个对象的hashCode不相同,也不再需要调用equals()方法,从而大大减少了equals()比较次数。

比如new 两个学生出来,两个学生的name和age一样,如果仅仅自定义重写了equals方法(比较name和age),那么这两个学生是相同的,视为同一个学生,但是事实在堆中实际上是有两个学生对象,是两个不同的地址,hashCode是jdk根据对象的地址或者字符串或者数字算出来的int类型的数值(百度来的),所以说这两个对象的hashcode大概率不同,如果把这两个学生,put到HashMap中,或者任何以哈希表为数据结构的集合中,都会出现两个"一样"的学生,这就违背了我们的初衷,我们使用HashMap,HashSet就是想为了去重复和效率,但是如果重写了equals而不重写hashcode,就达不到这样的效果.因为把这些对象塞进集合之前,会先判断hashcode,hashcode不同,直接塞进集合中,不去比较equals方法,这样你何必重写equals?所以产生矛盾.何必呢?

5.TreeSet,LinkedTreeSet,HashSet的区别

1、如果我们需要将元素排序,那么使用TreeSet
2、如果我们不需要排序, 使用HashSet, HashSet比TreeSet效率高
3、如果我们需要保留存储顺序, 又要过滤重复元素, 那么使用LinkedHashSet
TreeSet:自然排序,自然排序是根据集合元素的大小,以升序排列,
HashSet:无序
LinkedTreeSet:取出和存入顺序一致
@Test
public void testHashSet() throws Exception{
    HashSet hashSet = new HashSet();
    hashSet.add(2223);
    hashSet.add(13);
    hashSet.add(72);
    hashSet.add(2);
    Iterator iterator = hashSet.iterator();
    while (iterator.hasNext()) {
        Object next = iterator.next();
        System.out.println("hash = " + next);
    }
}

 完全无序

@Test
public void testTreeSet() throws Exception{
    TreeSet treeSet = new TreeSet();
    treeSet.add(2223);
    treeSet.add(13);
    treeSet.add(72);
    treeSet.add(2);

    Iterator iterator = treeSet.iterator();
    while (iterator.hasNext()) {
        Object next = iterator.next();
        System.out.println("tree = " + next);
    }
}

自然排序

 

@Test
public void testLinkedHashSett() throws Exception{
    LinkedHashSet linkedHashSet = new LinkedHashSet();
    linkedHashSet.add(2223);
    linkedHashSet.add(13);
    linkedHashSet.add(72);
    linkedHashSet.add(2);

    Iterator iterator = linkedHashSet.iterator();
    while (iterator.hasNext()) {
        Object next = iterator.next();
        System.out.println("linkedHashSet = " + next);
    }
}

存入和取出顺序一致

6.Set如何保证元素的唯一?为什么它是无序的

唯一

public boolean add(E e) {
     //PRESENT是一个虚拟值,是为了HashMap实现HashSet的一个假设的值
        return map.put(e, PRESENT)==null;
    }
当HashSet进行add操作时,其实是将要add的元素作为map的key,将PRESENT这个对象作为map的value,存入map中,并且需要注意到add方法的返回值是一个boolean。
其实到这里,我们应该能明白为什么HashSet中的元素不能重复了:
因为HashSet的底层是由HashMap实现的,而HashSet的add方法,是将元素作为map的key进行存储的,map的key是不会重复的,所以HashSet中的元素也不会重复。

无序

HashSet是根据hashcode来决定存放位置,所以无序,也就是说你不知道你存的值它在集合中的位置

7.ArrayList和LinkedList的区别

使用linkedList集合 不能使用多态
因为一些方法addfirst是linkedlist所特有的,所以不行

 

List的子类特点
          ArrayList:
             底层数据结构是数组,查询快,增删慢
             线程不安全,效率高
          Vector:
             底层数据结构是数组,查询快,增删慢
             线程安全,效率低
          LinkedList:
             底层数据结构是链表,查询慢,增删快
             线程不安全,效率高

8.TreeSet排序

Collections.sort(集合);
* integer,string都实现了comparable接口,所以可以用sort方法
* 所以sort的使用前提是被排序的集合里面存储的元素,必须实现comparable,
* 所以需要排序自定义的pojo,需要实现comparable接口!!
* 并重写接口中的方法compareTo定义排序的规则
* 规则:
* 自己(this) - 参数 = 升序
*              反之,降序
* comparable和comparator的区别
*   comparable:自己(this)和别人(参数)比较,自己需要实现comparable接口,重写比较的规则comparaTo方法
*   comparator:相当于找一个第三方的裁判,比较两个,可放在集合的构造器中当参数
* comparator的排序规则,第一个参数 - 第二个参数 = 升序 1,2,3
*   compare方法里面可以写多个规则
*   o1-o2:升序
*   反之,降序

 

 

【顶级EI完整复现】【DRCC】考虑N-1准则的分布鲁棒机会约束低碳经济调度(Matlab代码实现)内容概要:本文介绍了名为《【顶级EI完整复现】【DRCC】考虑N-1准则的分布鲁棒机会约束低碳经济调度(Matlab代码实现)》的技术资源,聚焦于电力系统中低碳经济调度问题,结合N-1安全准则与分布鲁棒机会约束(DRCC)方法,提升调度模型在不确定性环境下的鲁棒性和可行性。该资源提供了完整的Matlab代码实现,涵盖建模、优化求解及仿真分析全过程,适用于复杂电力系统调度场景的科研复现与算法验证。文中还列举了大量相关领域的研究主题与代码资源,涉及智能优化算法、机器学习、电力系统管理、路径规划等多个方向,展示了广泛的科研应用支持能力。; 适合人群:具备一定电力系统、优化理论和Matlab编程基础的研究生、科研人员及从事能源调度、智能电网相关工作的工程师。; 使用场景及目标:①复现高水平期刊(如EI/SCI)关于低碳经济调度的研究成果;②深入理解N-1安全约束与分布鲁棒优化在电力调度中的建模方法;③开展含新能源接入的电力系统不确定性优化研究;④为科研项目、论文撰写或工程应用提供可运行的算法原型和技术支撑。; 阅读建议:建议读者结合文档提供的网盘资源,下载完整代码与案例数据,按照目录顺序逐步学习,并重点理解DRCC建模思想与Matlab/YALMIP/CPLEX等工具的集成使用方式,同时可参考文中列出的同类研究方向拓展研究思路。
内容概要:本文详细介绍了一个基于MATLAB实现的电力负荷预测项目,采用K近邻回归(KNN)算法进行建模。项目从背景意义出发,阐述了电力负荷预测在提升系统效率、优化能源配置、支撑智能电网和智慧城市建设等方面的重要作用。针对负荷预测中影响因素多样、时序性强、数据质量差等挑战,提出了包括特征工程、滑动窗口构造、数据清洗与标准化、K值与距离度量优化在内的系统性解决方案。模型架构涵盖数据采集、预处理、KNN回归原理、参数调优、性能评估及工程部署全流程,并支持多算法集成与可视化反馈。文中还提供了MATLAB环境下完整的代码实现流程,包括数据加载、归一化、样本划分、K值选择、模型训练预测、误差分析与结果可视化等关键步骤,增强了模型的可解释性与实用性。; 适合人群:具备一定MATLAB编程基础和机器学习基础知识,从事电力系统分析、能源管理、智能电网或相关领域研究的研发人员、工程师及高校师生;适合工作1-3年希望提升实际项目开发能力的技术人员; 使用场景及目标:①应用于短期电力负荷预测,辅助电网调度与发电计划制定;②作为教学案例帮助理解KNN回归在实际工程中的应用;③为新能源接入、需求响应、智慧能源系统提供数据支持;④搭建可解释性强、易于部署的轻量级预测模型原型; 阅读建议:建议结合MATLAB代码实践操作,重点关注特征构造、参数调优与结果可视化部分,深入理解KNN在时序数据中的适应性改进方法,并可进一步拓展至集成学习或多模型融合方向进行研究与优化。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值