数据结构之散列查找

原创已于 2022-11-15 17:17:45 修改 · 6k 阅读

22 ·

CC 4.0 BY-SA版权

文章标签：

#数据结构

于 2022-11-14 17:43:22 首次发布

数据结构与算法笔记专栏收录该内容

37 篇文章

订阅专栏

散列表

散列表对应的值可称为hash（哈希值）
你可以理解为，散列表就是对应地址的映射，只不过
假设x为地址
g(x)就是对应的哈希值
x一样但是对于的g（x）可能一样这就产生了冲突

在这里插入图片描述
那么如何处理冲突呢？

一.拉链法

在这里插入图片描述

这样进行查找的话也可以
在这里插入图片描述
比如
27先代入对应的函数查hash值
然后去对应的hash表找对应的值
遍历对应位置的链表去对比就ok，如果最后都没有的话，就那个散列表就没有

关于查找长度奥

我们只关心对比关键字的次数
不关心对比空指针奥
在这里插入图片描述
比如查79
就需要比对14 1 27 和79
那就是4次

平均查找长度分析（ASL）

查找成功下
ASL成功=行数×对应行元素个数/元素数
或者就是所有元素查找之和/元素个数
在这里插入图片描述

最理想情况

在这里插入图片描述

就是冲突情况越多，查找效率越低
那么能不能设计一个哈希函数去尽可能减少冲突的发生呢？
这个问题后面讲

查找失败情况下的平均查找长度
查找失败，你肯定也是每一个散列表都访问的
这里我们没有查找成功奥
，所以我们不能以元素个数为分母了
我们要以行数，就是哈希表有多少元素做分母
我们用

从哈希表第0个元素到最后的链表所含关键字个数之和作为分子
就是对应行数要找几个呗，也可以说，关键字的个数就是分子
然后分母就是行数，查找失败就是查找不同的行失败呗
最后就是
ASL（失败）=关键字个数/哈希表中的元素个数
在这里插入图片描述
此参数也可叫装填因子
很重要！

常见散列函数（冲突比较少的）

1.除留余树法

在这里插入图片描述
质数取模，分布更均匀，冲突更少

2.直接定址法

在这里插入图片描述
这种是线性变化是不会产生冲突的，但是使用这种方法如果关键字不连续的话会导致空位较多

3.选取数码分布较为均匀的若干地址作为散列地址

在这里插入图片描述

4.平方取中法

在这里插入图片描述
取中间的几位

总结

在这里插入图片描述

二.开放定址法

在这里插入图片描述
差不多就是数码个意思呢
就是有对应的散列函数
1%13=1
案例来说与数组一是同义词
应该放到数组一的位置上，不过他可以放到数组三的位置上
对应的数组不仅可以接收同义词，也可以接收非同义词
那怎么判断这些对应的数组内到底是哪一个关键字呢？
一般规则接收，Hi=(H(key)+di)%m(表长)
那么这个di怎么知道呢？（i理解为第i次冲突，是对应的一个数的第i此冲突啊，不是相对于散列表而言的，不同的数从d0开始重新算）
用下面三种方法喽

1.线性探索法（重点）

只有发生冲突的时候用Hi公式，没有冲突还是按照H（key）的结果
di=0，1…，m-1
在这里插入图片描述
比如这个关键字序列
19，14和23的时候都是d0=0
就相当于遵循对应的散列变化呗
不过在1算的时候就和14对应的结果起了冲突
需要把d0变为d1
H=（1+d1）%15=2
所以1就要到2位置上了

之后就是一个个加呗
然后介绍84和19的冲突了呗
d0变为d1
又和20冲突
d1变为d2往后移两位就没冲突了，ok了放到8好位上
在这里插入图片描述
最后变成这样

查找

也是奥
在这里插入图片描述
比如你要探查27
正常规则就是27%13=1
看1位置是14
不匹配就根据新规则来呗
d0边d1一直到d3
到四位置的时候匹配了
一共匹配了四次

查找失败的话，与NULL对比的那次查找长度也算
，为什么空白就失败
想想
如果你找21，21就按照那个规则肯定是在84的后面且前面的元素肯定存满了，不可能说中间有空位
中间有空位21就应该在那个位置上
所以只要对比的是空白就是失败