构造哈希函数的目标是使得到的关键字的哈希地址尽可能均匀地分布在n个连续内存单元地址上,从而减少地址冲突。
根据关键字的结构和分布的不同,可构造出许多不同的哈希函数。
常用的构造哈希函数方法有
1、除留余数法
除留余数法是用关键字k除以某个不大于哈希长度m的数p (p<=m),将所得的余数作为哈希地址的方法。
h(k) = k mod p
这种方法的关键是选好p,使得元素集合中的每一个关键字通过该函数转换后映射到哈希表范围内的任意地址上的概率相等,从而减少发生冲突的可能性。
2、平方取中法
取关键字平方后分布均匀的几位作为哈希地址的方法
3、折叠法
将关键字分割成位数相同的及部分,然后取这几部分的叠加和(舍去进位)作为哈希地址。当关键字的位数很多且每一位的值都随机出现时,则折叠法可得冲突较少的哈希地址。
此外还有数字分析法、直接定址法等。
选择哈希函数时,通常考虑的因素有:
- 计算哈希函数所需的时间
- 关键字的长度
- 哈希表的大小
- 关键字的分布
- 记录的查找频率
常用的两种处理冲突的方法 开放定址法和链地址法。
开放定址法
链地址法
将所有关键字为同义词的记录存储在同一线性链表中。哈希表每个单元中存放的不再是元素本身,二十相应同义词单链表的头指针。