散列法(hash法、关键字地址计算法)

最新推荐文章于 2025-09-11 14:06:46 发布

原创最新推荐文章于 2025-09-11 14:06:46 发布 · 8.9k 阅读

12 ·

CC 4.0 BY-SA版权

文章标签：

#数据结构

数据结构同时被 2 个专栏收录

4 篇文章

订阅专栏

哈希法

4 篇文章

订阅专栏

本文介绍了散列法的基本概念，包括其存储原理、时间复杂度，以及构造哈希函数的多种方法，如除留余数法、数字分析法等。同时讨论了如何处理地址冲突的问题，比如开放定址法和链地址法。最后给出了哈希表的查找、插入、创建及删除等基本操作。

部署运行你感兴趣的模型镜像

散列法，又称为hash法或者关键字地址计算法。时间复杂度为0(理想情况下)，是一种key-value的存储方法。核心就是由hash函数决定关键字值和散列地址之间的关系，通过这种关系来组织存储并进行查找等操作。

散列法面临的问题：会发生地址冲突。
(1)如何恰当的构造hash函数，使得结点分布均匀，尽量少的减少冲突。
(2)一旦发生冲突，怎样处理冲突。

以下篇幅主要介绍hash函数的常用构造方法、处理冲突的方法以及和哈希表有关的算法。

这里写图片描述

接下来详细描述这几种构造方法：
① 除留余数法：用每个关键字的value值对p取余，用余数来填hash表。
p取小于或等于表长的最大素数。
② 数字分析法：取每个关键字的某几位作为hash表的地址。
③ 平方取中法：先将每个关键字平方，再按照数字分析法来取中间的几位作为hash表的地址。
④ 分段叠加法：将关键字分成位数相同的几部分，再叠加，用叠加后的结果中的某几位作为hash表的地址。叠加方式分为移位叠加和折叠叠加。
⑤ 基数转换法：将关键字看成另一种进制的数，再转换成为原进制，再取某几位作为散列的地址。

这里写图片描述

接下来详细描述处理冲突的方法：
处理冲突的实际含义就是为产生冲突的地址寻找下一个散列地址。
(1)开放定址法：又被称为再散列法。
① 线性探测再散列：需要注意的是整个表是一个首尾连接的循环表，每次遇到冲突时位置向后移一位。
② 二次探测再散列：整个表也是一个首尾相接的循环表，每次遇到冲突时位置按照1* 1, 2 * 2,3*3的位置变换顺序左右跳跃式判断。
③ 随机探测再散列：建立一个随机数发生器，并给定一个随机数作为起始点，按随机数的值确定下一个散列地址。

(2)链地址法：把所有具有地址冲突的关键字链在同一个单链表中。

这里写图片描述