JDK1.8源码解析-HashMap (二)

JDK1.8源码解析-HashMap II

承接上一篇《JDK1.8源码解析-HashMap I》,本篇主要介绍关于Java8针对HashMap在数据结构上的优化,涉及如何将链表优化成红黑树以及对红黑树的操作。


1. 概述

在上一篇中我们基于put方法分析了HashMap的底层实现,并且知道当hash产生碰撞,HashMap会以链表存放这些keyHash相同的键值对,并且当链表长度大于等于TREEIFY_THRESHOLD时,会将该链表转换成红黑树;另一方面,put元素时,当哈希桶中本身已经是红黑树(通过首元素instanceof TreeNode判断),调用TreeNode的putTreeVal方法插入红黑树。

2. 源码解析

2.1 HashMap.treeifyBin
final void treeifyBin(Node<K,V>[] tab, int hash) {
    int n, index; Node<K,V> e;
    // 如果table的长度小于最小的转换容量阈值,则通过哈希桶的扩容来达解决hash碰撞的问题
    if (tab == null || (n = tab.length) < MIN_TREEIFY_CAPACITY)
        resize();
    // e是桶中的首元素
    else if ((e = tab[index = (n - 1) & hash]) != null) {
        // 准备树中的临时变量, 头hd, 尾tl
        TreeNode<K,V> hd = null, tl = null;
        // 当
        do {
            // 将当前链表元素Node转为TreeNode
            TreeNode<K,V> p = replacementTreeNode(e, null);
            // 第一次循环,将hd指向链表头元素的地址
            if (tl == null)
                hd = p;
            // 后续循环中,将当前TreeNode的prev指向前一循环的TreeNode
            // 前一循环的TreeNode的next指向当前TreeNode
            else {
                p.prev = tl;
                tl.next = p;
            }
            // tl指向当前TreeNode
            tl = p;
        } while ((e = e.next) != null);
        // 重新规整以tab[index]为头的红黑树
        if ((tab[index] = hd) != null)
            hd.treeify(tab);
    }
}

treeifyBin首先确定是否要通过红黑树转换方法解决hash碰撞,在桶容量小于MIN_TREEIFY_CAPACITY的情况下,通过resize()扩容解决碰撞,因为绝大多数hash碰撞主要由于hash&len-1相同导致(取模),而非真正的keyHash相同导致,
而当cap很小时,这种情况将更加普遍,因此通过扩容,可以将部分原来在同一链表中的元素扩散到其他桶位置(上一篇resize分析中已经说过,对于这种情况,部分键值对将分布到hash&len-1 + oldCap的位置)。接下来,如果确实需要转换红黑树,则先预处理链表中的元素,将他们都把类型转换为TreeNode并把他们链接起来,再通过treeify方法将他们树化,形成符合红黑树特性的一棵平衡树。下面,我们再看看treeify怎么实现红黑树建立算法。

final void treeify(Node<K,V>[] tab) {
    TreeNode<K,V> root = null;
    // 开始遍历从当前树节点开始直至叶节点
    for (TreeNode<K,V> x = this, next; x != null; x = next) {
        // next指向当前节点的next
        next = (TreeNode<K,V>)x.next;
        // 初始化left & right
        x.left = x.right = null;
        // 第一次循环, 将root指
根据原作 https://pan.quark.cn/s/459657bcfd45 的源码改编 Classic-ML-Methods-Algo 引言 建立这个项目,是为了梳理和总结传统机器学习(Machine Learning)方法(methods)或者算法(algo),和各位同仁相互学习交流. 现在的深度学习本质上来自于传统的神经网络模型,很大程度上是传统机器学习的延续,同时也在不少时候需要结合传统方法来实现. 任何机器学习方法基本的流程结构都是通用的;使用的评价方法也基本通用;使用的一些数学知识也是通用的. 本文在梳理传统机器学习方法算法的同时也会顺便补充这些流程,数学上的知识以供参考. 机器学习 机器学习是人工智能(Artificial Intelligence)的一个分支,也是实现人工智能最重要的手段.区别于传统的基于规则(rule-based)的算法,机器学习可以从数据中获取知识,从而实现规定的任务[Ian Goodfellow and Yoshua Bengio and Aaron Courville的Deep Learning].这些知识可以分为四种: 总结(summarization) 预测(prediction) 估计(estimation) 假想验证(hypothesis testing) 机器学习主要关心的是预测[Varian在Big Data : New Tricks for Econometrics],预测的可以是连续性的输出变量,分类,聚类或者物品之间的有趣关联. 机器学习分类 根据数据配置(setting,是否有标签,可以是连续的也可以是离散的)和任务目标,我们可以将机器学习方法分为四种: 无监督(unsupervised) 训练数据没有给定...
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值