hashMap学习总结

本文深入探讨了HashMap的工作原理,包括其内部实现机制、碰撞处理方式及rehashing过程中的潜在问题。此外,还介绍了如何通过使用线程安全的ConcurrentHashMap来解决这些问题。

HashMap:他是一种映射表,也称为关联数据。他的值称为散列码。主要有 put(key, value)存储数据;get(key)从HashMap中获取对象。可以接受null为键值和值。可以使用toString方法打印键-值对。


可以通过构造器设置容量(默认值:16)和负载因子(默认值:0.75),以调整容器地性能。rehashing:当一个map填满了75%的bucket时候,将会创建原来HashMap大小的两倍的bucket数组,来重新调整HashMap的大小,并将原来的对象放入新的bucket数组中,此过程中重新调用hash方法找到新的bucket位置。


rehashing中的问题:

当重新调整HashMap大小的时候存在条件竞争,因为如果两个线程都发现HashMap需要重新调整大小了,它们会同时试着调整大小。在调整大小的过程中,存储在链表中的元素的次序会反过来,因为移动到新的bucket位置的时候,HashMap并不会将元素放在链表的尾部,而是放在头部,这是为了避免尾部遍历(tail traversing)。如果条件竞争发生了,那么就死循环了。

解决方案:使用线程安全的ConcurrentHashMap。

 

碰撞:当两个不同的键对象的hashcode相同时hashCode可能存在冲突的情况。

1、当键值对传递给put()方法时,它调用键对象的hashCode()方法来计算hashcode,让后找到bucketIndex来储存值(Entry)对象。

HashMap使用链表来解决碰撞问题,当发生碰撞了,对象将会储存在链表的下一个节点中。

2、当碰撞发生时,计算出的bucketIndex也是相同的,这时会取到bucketIndex位置已存储的元素,最终通过equals来比较。

 

根据原作 https://pan.quark.cn/s/459657bcfd45 的源码改编 Classic-ML-Methods-Algo 引言 建立这个项目,是为了梳理和总结传统机器学习(Machine Learning)方法(methods)或者算法(algo),和各位同仁相互学习交流. 现在的深度学习本质上来自于传统的神经网络模型,很大程度上是传统机器学习的延续,同时也在不少时候需要结合传统方法来实现. 任何机器学习方法基本的流程结构都是通用的;使用的评价方法也基本通用;使用的一些数学知识也是通用的. 本文在梳理传统机器学习方法算法的同时也会顺便补充这些流程,数学上的知识以供参考. 机器学习 机器学习是人工智能(Artificial Intelligence)的一个分支,也是实现人工智能最重要的手段.区别于传统的基于规则(rule-based)的算法,机器学习可以从数据中获取知识,从而实现规定的任务[Ian Goodfellow and Yoshua Bengio and Aaron Courville的Deep Learning].这些知识可以分为四种: 总结(summarization) 预测(prediction) 估计(estimation) 假想验证(hypothesis testing) 机器学习主要关心的是预测[Varian在Big Data : New Tricks for Econometrics],预测的可以是连续性的输出变量,分类,聚类或者物品之间的有趣关联. 机器学习分类 根据数据配置(setting,是否有标签,可以是连续的也可以是离散的)和任务目标,我们可以将机器学习方法分为四种: 无监督(unsupervised) 训练数据没有给定...
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值