在一般的线性表,树等存储结构中,每个记录的存储位置是随机的,若数据量过大,则查找过程中的逐个比较很是个问题,因此就提出了很多快速查找的方法,其中一个就是 hash 。
hash 表通过一定的映射,使记录的关键字与其存储位置建立联系,
但是这种映射,有可能会出现多个关键字对应同一个存储位置的问题,即哈希函数产生相同的地址。
处理地址冲突的方法:
1
、开放定址法
Hi=(H(key)+di) MOD m i=1,2,...,k(k<=m-1)
其中
m
为表长,
di
为增量序列
,
如果
di
值可能为
1,2,3,...m-1
,称线性探测再散列。
如果
di
取值可能为
1,-1,2,-2,4,-4,9,-9,16,-16,...k*k,-k*k(k<=m/2),
称二次探测再散列。
如果
di
取值可能为伪随机数列。称伪随机探测再散列。
2、再哈希法
当发生冲突时,使用第二个、第三个、哈希函数计算地址,直到无冲突时。缺点:计算时间增加。
3、链地址法
将所有关键字为同义词的记录存储在同一线性链表中。
4、建立一个公共溢出区
假设哈希函数的值域为
[0,m-1],
则设向量
HashTable[0..m-1]
为基本表,另外设立存储空间向量
OverTable[0..v]
用以存储发生冲突的记录。
……