数据结构之哈希表（散列表）

最新推荐文章于 2025-09-28 15:56:34 发布

原创最新推荐文章于 2025-09-28 15:56:34 发布 · 647 阅读

1 ·

CC 4.0 BY-SA版权

文章标签：

#算法 #数据结构

数据结构与算法专栏收录该内容

25 篇文章

订阅专栏

本文深入探讨了哈希表的基本原理，包括链式与开地址两种哈希表的构造方式，以及解决冲突的方法。同时介绍了哈希表在数据库系统、符号表和数据字典等场景中的广泛应用。

哈希表

哈希表的应用
链式哈希表
开地址哈希表
1.在链式哈希表中，用于访问哈希表的哈希编码实际上是对表取模后的值，这是为什么？
2.为什么哈希表适用于随机访问，不适用于顺序访问？
3. 在链式哈希表中查找元素时，什么是最坏的性能，如何预防？
4.在开地址哈希表中查找元素时，什么是最坏的性能，如何预防？

哈希表支持一种最有效的检索方法：散列。
从根本上说，一个哈希表包含一个数组，通过特殊的索引值（键）来访问数组中的元素。
哈希表的主要思想是通过一个 哈希函数，在所有可能的键与槽位之间建立一张映射表。哈希函数每次接受一个键将返回与键相对应的哈希编码或哈希值。键的类型可能多种多样，但哈希值的类型只能是整型。
由于计算哈希值何在数组中进行索引都只消耗固定的时间，因此哈希表的最大亮点在于： 它是一种运行时间在常量级的检索方法。
在理想状态，哈希函数能够保证不同的键生成的哈希值互不相同。但是在实际运用过程中，能够直接寻址的结果非常少。绝大多数哈希函数会将一些不同的键映射到相同的槽位上，当两个键映射到同一个槽位时，它们就产生了冲突。一个好的哈希函数能最大限度地减少冲突。但冲突不可能完全消除。
两种哈希表（解决冲突的方式不同）：

链式哈希表：将数据存储在“桶”（bucket）中的哈希表。每个“桶”都是一个哈希表，且链表的容量能够随着冲突的增加而增大。
开地址哈希表：将数据存储在表中，，而不是“桶”中的哈希表，它通过各种它探查方法来避免冲突问题
哈希算法的核心问题：选择哈希函数。 将键随机地分散到表中，使冲突最小化。

哈希表的应用

数据库系统：也就是追求高效的随机访问的地方。数据库系统主要有两种优化数据访问的方法：随机访问和顺序访问。哈希表是高效的随机访问方法的一个重要组成部分，因为它能在固定时间内定位数据。
符号表：符号表是编译器用来维护程序中符号信息的表。编译器会频繁地访问符号信息，因此，用更为高效的方法来实现符号表是非常重要的。
数据字典：一种支持数据的添加、删除和检索的数据结构。
关联数组

链式哈希表

链式哈希表从根本上来说是由一组链表组成。
每个链表看做是一个“桶”，我们将所有的元素通过散列的方式放到具体的不同的桶中。插入元素时，首先将其键传入一个哈希函数，函数通过散列的方式告知元素属于哪个“桶”，然后在其相应的链表头插入元素。查找或删除元素时，也是以相同的方式，先找到属于哪个“桶”，然后遍历相应的链表找到该元素。每个“桶”都是一个链表，所以链式哈希表并不限制包含元素的个数。然而如果表变得太大，它的性能将会降低。

链式哈希表解决冲突的方法

哈希表中两个键散列到一个相同的槽位时，这两个键就会产生冲突。链式哈希表解决冲突的办法：当冲突发生时，他就将元素放入已经准备好的“桶”中。但是也会带来一个问题：当过多的冲突发生在同一个槽位时，此位置的“桶”将会变得很深，从而造成访问此位置的元素所需的时间越来越长。
我们的目标就是尽可能均匀和随机地分配表中的元素。这种情况在理论上称为均匀散列。
如果想插入表中的元素数量远大于表中“桶”的数量，那么即使是均匀散列，其性能也会迅速降低。因此我们必须要注意一个哈希表的负载因子，其定义为：

负载因子α=表中元素个数n / “桶”的个数m
在均匀散列的情况下，负载因子能告诉我们表中“桶”能装下元素个数的最大值。

选择哈希函数

一个好的哈希函数旨在近似均匀散列。也就是尽可能以均匀和随机的方式散布一个哈希表中的元素。定义一个哈希函数h，它将键映射到哈希表中的位置x，x称为k的哈希编码，正式的表述为：

h(k)=x

取余法

有一个整型键k，一种最简单地将k映射到m槽位的散列方法是计算k除以m所得到的余数。取余法表达式：

h(k) = k mod m

乘法

乘法将整型键k乘以一个常数A（0<A<1），取结果的小数部分，然后乘以m取结果的整数部分。通常情况A取0.618,表达式：

h(k) = 取整（kA mod 1），A=0.618

开地址哈希表

在链式哈希表中，元素存放着每个地址的“桶”中。而在开地址哈希表中，元素存放在表本身，这种特性对于某些依赖于固定大小表的应用来说非常有效。

开地址哈希表冲突解决方法

在开地址哈希表中解决方式就是探查这个表，直到找到一个可以放置元素的槽，例如要插入一个元素，我们探查槽位直到找到空槽，然后将元素插入槽中。如果要删除或查找一个元素，我们探查槽位直到定位到该元素或直到找到一个空槽位。如果在找到元素之前找到一个空槽位或遍历完所有槽位，那么说明此元素不存在。
究竟经过多少次探查就停止，取决于两件事：