基本概念
hash:压缩映射(把大范围映射到小范围),数字签名.
hash函数的特点和要求
单向性
从hash值无法反向推导内容.
抗冲突性
映射分布均匀性
散列结果中,为 0 的 bit 和为 1 的 bit ,其总数应该大致相等;
输入中一个 bit 的变化,散列结果中将有一半以上的 bit 改变,这又叫做”雪崩效应(avalanche effect)”;
要实现使散列结果中出现 1bit 的变化,则输入中至少有一半以上的 bit 必须发生变化;
为什么是素数
hash函数的一个目标是 映射分布的均匀性,看例子
用一个合数8作为哈希表大小,0-15在哈希表中的散射情况:
余数 | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 |
---|---|---|---|---|---|---|---|---|
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | |
8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 |
用一个合数8作为哈希表大小,0-15的偶数在哈希表中的散射情况:
余数 | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 |
---|---|---|---|---|---|---|---|---|
0 | 2 | 4 | 6 | |||||
8 | 10 | 12 | 14 |
可以看到, 冲突比较厉害.
但是如果用质数7作为哈希表的大小. 0-15的偶数在哈希表中的散射情况:
余数 | 0 | 1 | 2 | 3 | 4 | 5 | 6 |
---|---|---|---|---|---|---|---|
0 | 2 | 4 | 6 | ||||
8 | 10 | 12 | |||||
14 |
可以看到,如果用质数, hash之后数据在hash表中散射更加均匀.