【数据结构】散列表（拉链法开发地址法处理冲突）解析+完整代码

吧啦吧啦嘭

于 2024-05-20 12:57:27 发布

阅读量1k

点赞数 29

分类专栏： # 数据结构文章标签：数据结构散列表算法 c++ c语言

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/m0_61628700/article/details/139062405

版权

5.散列表

5.1 概念

定义
- 散列表（哈希表 Hash Table）
  
  是一种数据结构。
  
  特点：可以根据数据元素的关键字计算出它在散列表中的存储地址。
- 散列函数（哈希函数）
  
  Addr=H(key)建立了“关键字 ==》存储地址”的映射关系。
- 冲突（碰撞）
  
  在散列表中插入一个数据元素时，需要根据关键字的值确定其存储地址，若该地址已经存储其他元素，则这种情况为冲突。
  
  减少冲突的方法：构造合适的散列函数
  
  解决冲突的方法：拉链法、开放定址法
- 同义词
  
  不同关键字通过散列函数映射到同一个地址，则这两个关键字是在该散列函数下的同义词。
散列表的查找效率取决于三个因素：散列函数、处理冲突的方法、装填因子

装填因子=表中记录数n/散列表长度m

装填因子越大，装填记录越满，发生冲突可能性越大。

5.2 构造

设计散列函数需要注意什么？

1.定义域必须包含所有可能出现的关键字；

2.值域不能超过散列表的地址范围；

3.尽可能减少冲突。散列函数计算出来的地址尽可能均匀分布在整个地址空间；

4.散列函数尽量简单，能快速计算任一关键词的散列地址。

以下介绍几种常见构造方法：

除留余数法

$H(key)=key\%p$

散列表表长m，取一个不大于m但最接近或等于m的质数p。

质数：又称素数，除了1和自身外，不能被其他自然数整除

用质数的原因：不被公因子影响，可以更均匀，减少冲突。

适用场景：较为通用，关键字是整数即可。
直接定址法

$H (k ey) = k ey$ 或 $H (k ey) = a * k ey + b$

其中，ab是常数。这种方法简单不会产生冲突。

但是如果关键字分布不连续，会浪费大量空间。

适用场景：关键字分布基本连续。
数字分析法

选取数码分布较为均匀的若干位作为散列地址。

如：以手机号后四位作为散列地址。

适用场景：关键字集合已知，且关键字的某几个数码位分布均匀。
平方取中法

取关键字的平方值的中间几位作为散列地址。

具体几位视情况而定。这种方法得到的散列地址与关键字的每位都有关，因此散列地址分布比较均匀。

适用场景：关键字的每位取值都不够均匀。

5.3 拉链法

定义

把所有同义词存储在一个链表中。
散列表的插入操作（拉链法解决冲突）
步骤：

1.结合散列表函数计算新元素的散列地址；

2.将新元素插入散列表对应的链表（可用头插法和尾插法）
- 头插法：
散列表的查找操作（拉链法解决冲突）

步骤：

1.根据散列函数计算目标的散列地址；

2.遍历查找链表所有元素。
散列表的删除操作（拉链法解决冲突）

1.根据散列函数计算目标的散列地址；

2.顺序查找散列表对应的链表，若查找成功，将目标元素从链表里删除。

完整代码

#include <stdio.h>
#include <stdlib.h>

#define SIZE 10

// 定义哈希表节点
typedef struct Node {
     
    int key;
    struct Node* next;
} Node;

// 创建节点
Node* createNode(int key) {
     
    Node* newNode = (Node*)malloc(sizeof(Node));
    if (newNode == NULL) {
     
        printf("Memory allocation failed!\n");
        exit(1);
    }
    newNode->key

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。