哈希表支持一种最有效的检索方法:散列。从根本上来说,一个哈希表包含一个数组,通过特殊的索引值(键)来访问数组中的元素。哈希表的主要思想是通过一个哈希函数,在所有可能的键与槽位之间建立一张映射表。哈希函数每次接受一个键将返回与键相对应的哈希值。键的数据类型可能多种多样,但哈希值的类型只能是整型。
通常与各种各样的键相比,哈希表的条目数相应较少。因此,绝大多数哈希函数会将一些不同的键映射到表中相同的槽位上。当两个键映射到一个相同的槽位上时,它们就产生了冲突。下面介绍两种类型的哈希表,它们以不同的方式解决冲突问题。
链式哈希表
将数据存储在“桶”(bucket)中的哈希表。每个“桶”都是一个链表,且链表的容量能够随着冲突的增加而增大。
开地址哈希表
将数据存储在表本身中,而不是“桶”中的哈希表。它通过各种探查方法来避免冲突问题。
选择哈希函数
这是哈希算法的核心问题:将键随机地分散到表中,使冲突最小化。因此,选择一个能够实现这一个过程的哈希函数尤为重要。
冲突解决
当有多个键映射到相同的索引时解决键冲突问题。链式哈希表以固有的方式(因为其包含链表)来解决冲突。开地址哈希表通过各种形式的探查方法来解决冲突。