在哈希表(Hash Table)中,哈希函数的作用是将输入的键(Key)映射到哈希表中的一个索引位置,以便快速访问数据。哈希冲突(Hash Collision)指的是:两个不同的键经过哈希函数计算后,得到了相同的哈希值(即映射到了哈希表中的同一个索引位置)。
举个例子:
假设哈希函数为 hash(key) = key % 5(取余运算):
- 当
key = 3时,hash(3) = 3 % 5 = 3 - 当
key = 8时,hash(8) = 8 % 5 = 3
这里,3 和 8 是不同的键,但哈希值都是 3,就发生了哈希冲突。
为什么会发生哈希冲突?
哈希表的容量是有限的(比如大小为 n),而可能的键的范围通常远大于 n(甚至是无限的,比如字符串可以有任意长度)。根据鸽巢原理(如果有 n 个鸽巢和 n+1 只鸽子,至少有一个鸽巢里有两只鸽子),当插入的键数量超过哈希表容量时,必然会出现冲突。
如何解决哈希冲突?
常见的解决方法有两种:
-
开放寻址法(Open Addressing)
当发生冲突时,通过某种规则(如线性探测、二次探测、双重哈希等)在哈希表中寻找下一个空闲位置存储数据。例如,线性探测会依次检查下一个索引i+1, i+2, ...直到找到空位。 -
链地址法(Chaining)
哈希表的每个索引位置不直接存储数据,而是指向一个链表(或其他数据结构)。当冲突发生时,新数据会被插入到对应索引的链表中。查询时,需要遍历链表找到目标键。
实际应用中,链地址法更为常用(如 Java 的 HashMap、Python 的字典等),因为它实现简单且对哈希表的负载因子(存储元素数 / 容量)不敏感。
哈希冲突是哈希表设计中不可避免的问题,合理的冲突解决策略能保证哈希表的高效性。
743

被折叠的 条评论
为什么被折叠?



