c/c++ hash表 (哈希表、字典表)

本文深入探讨哈希表的工作原理及其如何通过哈希算法提高数据查找效率,并介绍哈希表的设计与实现方法。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1: 表: 存储数据 key –> value;

这里写图片描述


2: 表存储数据结构的困难:
怎么查找? 一个一个key去比较去查找?==效率不高

这里写图片描述


**3: Hash算法加快查找;
将字符串的key,转成整数,使用整数找到对应的value;**

Hash算法将字符串转成整数,同样的Hash值得 key:value会放到一个集合里面,由于Hash能使得不同的字符串尽量有不同的整数值(仍然有重复);
将海量的数据,按照HASH值分成不同的集合,先找集合,再找key–>value,大大提高效率;

这里写图片描述


Hash表设计

1: key, value节点:
struct hash_node {
char* key;
void* node;
struct hash_node* next;
};

2: hash算法: 选取一种HASH算法;
3: 有限的集合数目, 定义一个集合数目,每个集合的元素用链表连接;
4: 对用户开放的hash表接口;
struct hash_table* creator_hash_table(集合的数目);
void destroy_hash_table(struct hash_table*);
void* hash_find(table, char* key);
hash_delete(table, char* key);
hash_insert(table, char*key, void* value); // 直接插入,不判断是否有key重复;
hash_set(table, char* key, void* value); // 如果key存在就覆盖,如果不存在返回;


  • 身份证(key):数据信息(value),如果我们有10000个学生,查找一个学生的话,很费劲;
  • 如果说有一个办法能均匀的将10000个人分成n个集合,(N100*100)我们有一种办法能快速的找到key,所对应的集合,那么就能很快的在集合里面找出所对应的value;
  • 怎么根据key来分集合;
  • 怎么分能够相对比较均匀;
  • 采用Hash算法
    • 1:将一个字符串变成一个整数 %N规模(0,N-1)的集合序号里面
    • 整数 %N = 集合序列号,[0,n-1],用数组来表示每个集合;
    • 2:对于不同的字符串,尽可能的生成不同的Key;
      • Hash散列,要散得足够均匀;
      • “hello”–>3;
      • “helmm” –>7;
      • 随机的字符串样本,能均匀的分布出来,分散开来;
    • 主流的Hash算法;

创建Hash结构

这里写图片描述

这里写图片描述


创建hash对象

这里写图片描述


这里写图片描述


引用mysql经典算法函数

这里写图片描述


增/插入数据

这里写图片描述


这里写图片描述


删除表

这里写图片描述

这里写图片描述


删除hash对象

这里写图片描述


这里写图片描述


修改数据

这里写图片描述

这里写图片描述


查询数据

这里写图片描述

这里写图片描述


这里写图片描述

总结

1: 理解HASH表的原理,为什么能实现基于名字快速查找;
2: 理解HASH算法;
3: 编写HASH表;


–>源码

### C++哈希表的使用方法与数据结构实现 在C++中,哈希表是一种高效的数据结构,用于存储键值对。它通过哈希函数将键映射到中的一个位置来访问记录,从而提高查找效率[^1]。以下是关于C++哈希表的具体实现和使用方法的详细说明。 #### 哈希表的基本概念 哈希表的核心在于哈希函数的设计以及冲突解决机制的选择。哈希函数负责将键转换为索引,而冲突(即不同键映射到相同索引)通常通过链地址法或开放定址法解决[^3]。 #### 使用标准库中的`unordered_map` C++标准库提供了`std::unordered_map`作为内置的哈希表实现。它的接口类似于`std::map`,但内部基于哈希表实现,因此具有更快的平均查找时间复杂度O(1)。 ```cpp #include <iostream> #include <unordered_map> int main() { std::unordered_map<int, std::string> hash_table; hash_table[1] = "one"; hash_table[2] = "two"; if (hash_table.find(1) != hash_table.end()) { std::cout << "Key 1 exists with value: " << hash_table[1] << std::endl; } return 0; } ``` 上述代码展示了如何定义、插入和查找`std::unordered_map`中的元素[^2]。 #### 自定义哈希表的实现 如果需要更灵活的控制,可以手动实现哈希表。以下是一个简单的链地址法实现: ```cpp #include <list> #include <vector> #include <utility> #include <functional> template<typename K, typename V> class HashTable { private: std::vector<std::list<std::pair<K, V>>> table; size_t size; public: HashTable(size_t initial_size = 10) : table(initial_size), size(0) {} void insert(const K& key, const V& value) { size_t index = std::hash<K>{}(key) % table.size(); for (auto& pair : table[index]) { if (pair.first == key) { pair.second = value; // 更新值 return; } } table[index].emplace_back(key, value); ++size; } bool find(const K& key, V& value) const { size_t index = std::hash<K>{}(key) % table.size(); for (const auto& pair : table[index]) { if (pair.first == key) { value = pair.second; return true; } } return false; } void remove(const K& key) { size_t index = std::hash<K>{}(key) % table.size(); for (auto it = table[index].begin(); it != table[index].end(); ++it) { if (it->first == key) { table[index].erase(it); --size; return; } } } }; ``` 此代码片段展示了一个基本的哈希表实现,其中每个桶是一个链,用于存储键值对,并通过`std::hash`计算哈希值。 #### 处理哈希冲突 当两个不同的键映射到相同的索引时,会发生哈希冲突。上述自定义实现中使用了链地址法来解决冲突,即将所有冲突的键值对存储在同一链中[^3]。 #### 性能优化 为了提高哈希表的性能,可以选择合适的初始大小和负载因子(load factor)。负载因子是哈希表中存储的元素数量与桶的数量之比。当负载因子过高时,冲突的可能性增加,从而降低性能。因此,动态调整哈希表的大小以保持较低的负载因子是很重要的。
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值