散列结构的查找

本文介绍了散列结构的查找原理,包括散列函数的设计要求,如直接定址法、除留余数法等,并探讨了处理冲突的方法,如开放定址法和拉链法,以及散列表的查找效率与装填因子的关系。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

散列结构的查找:

散列函数:一 个把查找表中的关键字映射成该关键字对应的地址的函数,记为Hash(key)=Address。
冲突:散列函数可能会把两个或两个以上的关键字映射到同一地址。
散列表:根据关键字直接进行访问的数据结构,对散列表的查找的时间复杂度为O(1)。
散列函数的构造:
要求:
①散列函数的定义域必须包括所有的要储存的关键字,而值域范围依赖于散列表的大小或地址范围。
②散列函数计算出来的地址应该等概率,均匀的分布在整个地址空间,从而减少冲突的发生。
③散列函数应尽可能简单,能够在较短时间内计算出关键字的地址。
方法:
直接定址法
取关键字的线性函数值作为地址。
H(key)=a*key+b
除留余数法
取一个不大于散列表长,但接近它的数字p
H(key)=key % p
数字分析法
r进制数对于r个数来说,已知的关键字序列其中r个数出现的频率不同,
所以应该选择分布较为均匀的若干位作为散列地址。
平方取中法
取关键字的平方数的中间几位作为散列地址,
适用于关键字的每一位都分布不均匀或都小于散列地址所需的位数
折叠法
将关键字分割成位数相同的几部分,然后取这几部分的叠加和作为散列地址。
适用于关键字位数很多,且每一位关键字数字大小分布均匀。

处理冲突的办法:

开放定址法:
定义:可存放新表项的空闲地址既向它的同义词表项开放, 又向它的非同义词表项开放。
Hi=(H(key)+di) % m
线性探测法:

增量序列di=0,1,2,3,…
容易导致大量的元素在相邻的散列地址上“堆积”。
平方探测法:
增量序列di=0的平方,1的平方,- 的1的平方,2的平方…
不能探测散列表中所有单元,但是至少能探测到一半的单元。
再散列法:
增量序列= i *H2(key)
最多经过m-1次探测就能遍历表中所有位置,回到H0位置。
伪随机数法:
增量序列= 伪随机数序列

拉链法:

定义: 避免冲突,将同义词存储在同一个线性链表中。
线性链表
适用于经常插入删除的情况。

散列表的查找效率:

散列函数的查找效率取决于三个因素:散列函数、处理冲突的方法和装填因子
装填因子:散列表的装填因子一般记为α,定义为一个表的装满程度,即: 表中记录数n / 散列表长度m

装填因子越大,发生冲突的可能性越大。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值