【HashMap源码】

HashMap1.8源码分析
基本属性
	// 初始化容量——2的幂次方
	static final int DEFAULT_INITIAL_CAPACITY = 1 << 4; 
	
	// HashMap的桶的最大个数
	static final int MAXIMUM_CAPACITY = 1 << 30;
	
	// 负载因子
	static final float DEFAULT_LOAD_FACTOR = 0.75f;

	// 树化阈值
	static final int TREEIFY_THRESHOLD = 8;

	// 树退化阈值
	static final int UNTREEIFY_THRESHOLD = 6;

	// 树化最小容量
	static final int MIN_TREEIFY_CAPACITY = 64;
	
	// tarnsient 不参与序列化
	transient Node<K,V>[] table;

	transient Set<Map.Entry<K,V>> entrySet;

	transient int size;

	transient int modCount;

 	int threshold;

	final float loadFactor;

常见方法源码分析
构造方法
	public HashMap() {
      	// 初始化时设置负载因子为默认值
        this.loadFactor = DEFAULT_LOAD_FACTOR; 
    }

	public HashMap(int initialCapacity) {
        this(initialCapacity, DEFAULT_LOAD_FACTOR);
    }
		
    /**
     * 1.对初始化容量和负载因子进行限制
     * 2.设置负载因子
     * 3.确定初始化大小
     */
	public HashMap(int initialCapacity, float loadFactor) {
        if (initialCapacity < 0)
            throw new IllegalArgumentException("Illegal initial capacity: " +
                                               initialCapacity);
        if (initialCapacity > MAXIMUM_CAPACITY)
            initialCapacity = MAXIMUM_CAPACITY;
        if (loadFactor <= 0 || Float.isNaN(loadFactor))
            throw new IllegalArgumentException("Illegal load factor: " +
                                               loadFactor);
        this.loadFactor = loadFactor;
      	// 这里将初始化容量放到了阈值进行保存
        this.threshold = tableSizeFor(initialCapacity);
    }

HashMap调用构造函数后,并不会立即初始化,只有第一次放置元素时才会初始化。

好处:节省内存

tableSizeFor()
  /**
   * 假定cap为16
   */
	static final int tableSizeFor(int cap) {
        int n = cap - 1;	
        // n = 15 二进制:0000 0000 0000 0000 0000 0000 0000 1111
    	// n			0000 0000 0000 0000 0000 0000 0000 1111
    	// n >>> 1		0000 0000 0000 0000 0000 0000 0000 0111
    	// n | n >>> 1	0000 0000 0000 0000 0000 0000 0000 1111
        n |= n >>> 1;
        n |= n >>> 2;
        n |= n >>> 4;
        n |= n >>> 8;
        n |= n >>> 16;
        return (n < 0) ? 1 : (n >= MAXIMUM_CAPACITY) ? MAXIMUM_CAPACITY : n + 1;
    }

通过位运算,找到比初始化容量大的最小的2次幂

HashMap容量设置为2次幂是为了利用位运算来优化哈希函数的计算效率。

当HashMap为2次幂时可以通过与运算代替取模定位到存储位置。

put()
 	public V put(K key, V value) {
        return putVal(hash(key), key, value, false, true);
    }
putVal()
	/**
     * @param onlyIfAbsent  true-如果key不存在才添加,false-不管key是否存在都添加
     * @param evict false-表示当前HashMap处于创建状态,即当前正在初始化HashMap true-正常操作模式
     */
	final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
                   boolean evict) {
        Node<K,V>[] tab; Node<K,V> p; int n, i;
      	// 第一次使用时需要初始化
        if ((tab = table) == null || (n = tab.length) == 0)
            n = (tab = resize()).length;
      	// 该位置无元素
        if ((p = tab[i = (n - 1) & hash]) == null)
            tab[i] = newNode(hash, key, value, null);
        else {
            Node<K,V> e; K k;
          	// 当前节点与插入节点key相等
            if (p.hash == hash &&
                ((k = p.key) == key || (key != null && key.equals(k))))
                e = p;
          	// 树节点
            else if (p instanceof TreeNode)
                e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
            else {
                for (int binCount = 0; ; ++binCount) {
                    if ((e = p.next) == null) {
                      	// 在链表末尾插入元素
                        p.next = newNode(hash, key, value, null);
                      	// 达到树化阈值
                        if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
                            treeifyBin(tab, hash);
                        break;
                    }
                  	// 存在当前节点e和当前新建节key想同
                    if (e.hash == hash &&
                        ((k = e.key) == key || (key != null && key.equals(k))))
                        break;
                    p = e;
                }
            }
          	// 更新操作
            if (e != null) { // existing mapping for key
                V oldValue = e.value;
                if (!onlyIfAbsent || oldValue == null)
                    e.value = value;
                afterNodeAccess(e);
                return oldValue;
            }
        }
        ++modCount;
      	// 放入元素后,如果达到阈值进行扩容
        if (++size > threshold)
            resize();
        afterNodeInsertion(evict);
        return null;
    }

放入元素时:如果HashMap未初始化,resize()初始化

如果元素存储位置不存在Hash桶,新建Node存储

如果插入处,头结点和插入节点key相同,直接覆盖

如果是树节点,putTreeVal()

流程图如下:
在这里插入图片描述

resize()
	final Node<K,V>[] resize() {
        Node<K,V>[] oldTab = table;
        int oldCap = (oldTab == null) ? 0 : oldTab.length;
        int oldThr = threshold;
        int newCap, newThr = 0;
        if (oldCap > 0) {
          	// 旧容量是否大于最大容量
            if (oldCap >= MAXIMUM_CAPACITY) {
              	// 阈值设置为Integer最大值
                threshold = Integer.MAX_VALUE;
                return oldTab;
            }
            else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY &&
                     oldCap >= DEFAULT_INITIAL_CAPACITY)
              	// 阈值两倍扩容
                newThr = oldThr << 1; // double threshold
        }
        else if (oldThr > 0) // initial capacity was placed in threshold
          	// 初始化时将容量放到了阈值里
            newCap = oldThr;
        else {               // zero initial threshold signifies using defaults
            newCap = DEFAULT_INITIAL_CAPACITY;
            newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);
        }
        if (newThr == 0) {
          	// 设置阈值,解决初始化时阈值设置为容量的问题
            float ft = (float)newCap * loadFactor;
            newThr = (newCap < MAXIMUM_CAPACITY && ft < (float)MAXIMUM_CAPACITY ?
                      (int)ft : Integer.MAX_VALUE);
        }
        threshold = newThr;
        @SuppressWarnings({"rawtypes","unchecked"})
        Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap];
        table = newTab;
      	// 扩容
        if (oldTab != null) {
          	// 遍历每个Hash桶
            for (int j = 0; j < oldCap; ++j) {
                Node<K,V> e;
                if ((e = oldTab[j]) != null) {
                    oldTab[j] = null;
                  	// 桶内只有一个节点
                    if (e.next == null)
                        newTab[e.hash & (newCap - 1)] = e;
                  	// 该桶内存放的是红黑树节点
                    else if (e instanceof TreeNode)
                        ((TreeNode<K,V>)e).split(this, newTab, j, oldCap);
                    else { // preserve order
                      	// 将该桶内的节点与容量相与,放到两个Hash桶中
                        Node<K,V> loHead = null, loTail = null;
                        Node<K,V> hiHead = null, hiTail = null;
                        Node<K,V> next;
                        do {
                            next = e.next;
                          	// 0001 1000
                          	// 0000 1000
                            if ((e.hash & oldCap) == 0) {
                                if (loTail == null)
                                    loHead = e;
                                else
                                    loTail.next = e;
                                loTail = e;
                            }
                            else {
                                if (hiTail == null)
                                    hiHead = e;
                                else
                                    hiTail.next = e;
                                hiTail = e;
                            }
                        } while ((e = next) != null);
                        if (loTail != null) {
                            loTail.next = null;
                            newTab[j] = loHead;
                        }
                        if (hiTail != null) {
                            hiTail.next = null;
                            newTab[j + oldCap] = hiHead;
                        }
                    }
                }
            }
        }
        return newTab;
    }

扩容时先判断是否执行了初始化

  • 执行了初始化
    • 旧容量>最大容量 修改阈值为Integer.MAX_VALUE
    • 最大容量>=旧容量>=初始容量 2倍扩容
  • 未执行初始化
    • 设置了阈值,这个阈值就是新容器的容量
    • 根据默认容器大小和负载因子进行阈值计算

如果容器有值则进行扩容,否则初始化直接返回

扩容是2倍扩容,将原来的数据移到新的哈希表中;这里采用hash&旧容量,确定在新数组的位置

流程图如下:

在这里插入图片描述

### Java HashMap 源码解析 Java 的 `HashMap` 是基于哈希表实现的一种数据结构,它允许存储键值对 (Key-Value Pair),并支持快速的插入、删除和查找操作。以下是关于其内部工作原理的一些关键点: #### 数据结构设计 `HashMap` 使用数组加链表(或者红黑树)的方式来解决哈希冲突问题。具体来说: - **数组**:用于存储桶 (Bucket)。 - **链表/红黑树**:当多个键映射到同一个桶时,这些键会以链表的形式存储;如果链表长度超过一定阈值,则转换为红黑树。 这种设计使得在大多数情况下可以保持 O(1) 时间复杂度的操作性能[^3]。 #### 主要成员变量 以下是 `HashMap` 类中几个重要的字段及其作用: - `transient Node<K,V>[] table`: 存储实际数据的数组。 - `final float loadFactor`: 负载因子,默认值为 0.75,表示何时需要扩容。 - `int threshold`: 当前容量乘以负载因子的结果,决定了什么时候触发重新调整大小的动作。 - `static final int TREEIFY_THRESHOLD = 8`: 如果某个桶上的节点数量达到此数值,则该链表会被转化为一棵平衡二叉搜索树。 #### 核心方法剖析 1. **put 方法** 插入新元素时,先计算 key 对应 hash 值的位置 index。如果目标位置为空则直接放置新的 Entry;否则遍历已有条目寻找相同 Key 或者处理碰撞情况。 2. **get 方法** 获取指定 key 所关联 value 过程相对简单明了——依据同样的逻辑定位至相应索引处再逐一匹配直至找到完全一致项为止即可返回对应 Value 值。 ```java // 示例代码展示 put 和 get 的基本流程 public V put(K key, V value) { return putVal(hash(key), key, value, false, true); } final V putVal(int hash, K key, V value, boolean onlyIfAbsent, boolean evict) { Node<K,V>[] tab; Node<K,V> p; int n, i; if ((tab = table) == null || (n = tab.length) == 0) n = (tab = resize()).length; if ((p = tab[i = (n - 1) & hash]) == null) tab[i] = newNode(hash, key, value, null); else { ... } } ``` --- ### C++ Hashmap 实现原理 尽管标准库并没有提供名为 “hashmap” 的容器类型名称,但实际上我们可以利用 STL 提供的标准模板类 unordered_map 来完成类似功能开发任务需求[^2]。 #### 关键特性对比 | 特性 | std::unordered_map | |-----------------|-----------------------------------------| | 底层实现 | 开放寻址法 / 拉链法 | | 平均时间复杂度 | 查找、插入、删除均为 O(1) | 值得注意的是,在某些特定场景下由于存在大量重复 keys 导致频繁 rehashing 可能会使最坏情形退化成接近线性的表现效果。 --- ### Python Dict 内部结构 Python 字典 (`dict`) 同样采用了类似的哈希表机制作为基础构建单元之一[^4]。然而为了进一步优化空间利用率以及提升运行效率等方面考虑引入了一些额外改进措施比如紧凑型分配策略等等从而形成了独具特色的版本特点如下所示: - **动态增长**: 初始状态下仅占用少量内存区域随着不断新增项目逐步按需扩展规模直到满足当前所需为止. - **探查序列**: 解决冲突采用开放地址技术即一旦发现预设槽位已被占据便沿着固定模式继续向前探索下一个可用选项. 另外还有一点特别之处在于 Pyhton3.x 系列之后对其做了重要改动取消了原本单独维护顺序信息的做法转而依靠原生词条布局自然形成访问次序记录因此既保留原有优势又能节省更多资源消耗. ```python # 创建一个简单的字典对象演示如何运作 my_dict = {"apple": 1, "banana": 2, "cherry": 3} print(my_dict["banana"]) # 输出结果应该是 '2' ``` ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值