《字典与集合的魔法：深入探索 CPython 的哈希表实现机制》

最新推荐文章于 2025-12-10 17:37:43 发布

原创

最新推荐文章于 2025-12-10 17:37:43 发布 · 857 阅读

CC 4.0 BY-SA版权

文章标签：

在 Python 的世界里，dict 和 set 是使用最频繁也最强大的数据结构之一。你可能已经习惯了用字典做配置项，或者用集合去重列表中的元素。它们使用起来轻便高效，插入、查找和删除操作几乎毫无延迟——但你是否曾好奇：为何这么快？它们背后的魔法又是什么？

今天这篇文章，我们将深入 CPython 的核心，探索 dict 和 set 在底层的实现细节，揭示它们为何能以 $O (1)$ 平均时间复杂度运行的真相。无论你是初学者还是资深开发者，这篇文章都将带你揭开哈希表的面纱，并提供实用的优化建议。

在 CPython 中，set 是字典的简化版本，仅存储键而不存储值。这种设计不仅统一了内存结构，也大大提升了运行效率。

哈希表是计算机科学中一种以常数时间存取元素的数据结构。其核心思想是：

这样，我们就能在近乎常数时间完成插入、查找和删除操作。

从 Python 3.6 开始，dict 改用了新的更紧凑的结构，以便更好支持遍历顺序和节省内存。

核心组件如下：