Hash函数的随机性越好,数据分布越均匀;数据分布越均匀,冲突就越少;冲突越少,效率就越高。
设计Hash表的关键之一就是处理数据的冲突。
1. 整数的Hash函数
(1)直接取余法
,h(k) = k mod M
(2)平方取中法
,h(k) = r (k2 ),其中r()表示取k2 的中间r位。
如:
n r = 4, k = 100
n k = (1100100) 2
n k 2 = (10011 1000 10000) 2
n h(k) = (1000) 2 = 8
(3) 乘积取整法
,用 k 乘以一个 (0,1) 中的无理数 A , 取出小数部分,乘以 M ,再取出整数部分作为 h(k)
如:
n k = 100, A = 0.61803 … , M = 12
n h(k) = 9
比较这三种方法:
直接取余法: 实现容易 ,效果受 M 影响大
平方取中法 :速度快 ,不容易推广
乘积取整法: M 可以任取,效果好, 速度慢
Hash 函数、Hash表
本文探讨了哈希函数的设计及其对数据冲突的影响。介绍了三种常见哈希方法:直接取余法、平方取中法及乘积取整法,并对比了它们的特点与适用场景。

被折叠的 条评论
为什么被折叠?



