HashMap加载因子为什么是0.75？转化红黑树阈值为8？

最新推荐文章于 2025-02-19 15:30:40 发布

原创

最新推荐文章于 2025-02-19 15:30:40 发布 · 2.8k 阅读

CC 4.0 BY-SA版权

文章标签：

HashMap的加载因子选择0.75是基于泊松分布的考虑，以平衡空间利用率和查找效率。当链表长度达到8时转为红黑树，是因为在0.75的负载因子下，超过8个元素的概率极低，确保高效操作。

加载因子是哈希表在其容量自动增加之前可以达到多满的一种尺度，它衡量的是一个散列表的空间的使用程度，负载因子越大表示散列表的装填程度越高，反之愈小。

对于使用链表法的散列表来说，查找一个元素的平均时间是 O(1+a)。因此如果负载因子越大，对空间的利用更充分，然而后果是查找效率的降低；如果负载因子太小，那么散列表的数据将过于稀疏，对空间造成严重浪费。

如果你看过源代码，你会发现在初始条件下，HashMap在时间和空间两者间折中选择了0.75。

/**
* The load factor used when none specified in constructor.
*/

static final float DEFAULT_LOAD_FACTOR = 0.75f;

但是为什么一定是0.75？而不是0.8，0.6，这里有一个非常重要的概念：泊松分布。

相信大家都学过概率论，对这个大名鼎鼎的定律感觉应该是既熟悉又陌生。本篇文章的重点不是为大家普及概率论知识，这里就简单介绍下。

泊松分布是最重要的离散分布之一，它多出现在当X表示在一定的时间或空间内出现的事件个数这种场合。

举个简单的例子，假如你一个老板，新开张了一家酒店，这个时候应该如何准备一天所用的食材呢？

准备的太多，最后卖不掉这么多菜只能浪费扔掉；准备不够，又接不了生意。但是你有很多同行和朋友，他们会告诉你很多经验。

比如把一天分成几个时间段，上午、下午、晚上每个时间段大概会来多少个