C++的unordered_set和unordered_map

本文探讨使用哈希表优化枚举算法,介绍C++ STL提供的unordered_set与unordered_map,对比set与map,强调其在查找、插入和删除操作中的时间复杂度优势。

今天是我们枚举与优化的第二节课。今后几节课我们会一起来讨论用哈希表来优化枚举,降低复杂度。 我们在用程序解决问题时候,经常会碰到这样一类问题:“查找一个元素是否存在”,比如一个整数是不是在一个整数集合中。 要解决这样的问题,哈希表是一个非常好用的工具。而且更方便的是,C++的STL已经帮我们把这些工具都实现好了,提供了非常方便的接口,我们直接用行了。下面我们就介绍一下这些工具。 首先我们要介绍的就是unordered_setunordered_map

unordered_set可以把它想象成一个集合,它提供了几个函数让我们可以增删查:
unordered_set::insert
unordered_set::find
unordered_set::erase

这个unorder暗示着,这两个头文件中类的底层实现----Hash。 也是因为如此,你才可以在声明这些unordered模版类的时候,传入一个自定义的哈希函数,准确的说是哈希函数子(hash function object)。

单向迭代器

哈希表的实现复杂了该容器上的双向遍历,似乎没有一种合适的方法能够做到高效快速。 因此,unorder版本的map和set只提供前向迭代器(非unorder版本提供双向迭代器)。

首先要include这个unordered_set头文件。
然后就是第六行我们定义了一个整型int的集合,叫myset。
后面几行,我们演示了insert/find/erase的用法。
有两点需要注意:
一是这个容器是个集合,所以重复插入相同的值是没有效果的。大家可以看到我们这里第7行和第9行插入了2次3,实际上这个集合里也只有1个3,第10行输出的结果是2。
二是find的返回值是一个迭代器(iterator),如果找到了会返回指向目标元素的迭代器,没找到会返回end()。

对于unordered_set,insert/find/erase的平均复杂度是O(1),但是最坏复杂度是O(N)的,这里N是指容器中元素数量。

有两种情况会出现O(N)复杂度。
1是你的哈希函数太烂了,导致很多不同元素的哈希值都相同,全是碰撞,这种情况复杂度会变成O(N)。但是这种情况一般不用担心,因为对于string以及int double之类的基本数据类型,都有默认的哈希函数,而且默认的哈希函数足够好,不会退化到O(N)。如果是你自定义的哈希函数,那你要小心一点,别写的太差了。
2是如果insert很多数据,会触发rehash。就是整个哈希表重建。这个过程有点类似向vector里不断添加元素,vector会resize。比如你新建一个vector时,它可能只申请了一块最多保存10个元素的内存,当你插入第11个元素的时候,它会自动重新申请一块更大空间,比如能存下20个元素。哈希表也是类似,不过rehash不会频繁发生,均摊复杂度还是O(1)的,也不用太担心。

unordered_set是一个集合,有的时候我们需要一个字典,就是保存一系列key/value对,并且可以按key来查询。比如我们要保存很多同学的成绩,每位同学有一个学号,也有一个分数,我们想按学号迅速查到成绩。这时候我们就可以用unordered_map。

unordered_map同样也提供了增删查函数:
unordered_map::insert
unordered_map::find
unordered_map::erase
这三个函数的平均时间复杂度也是O(1)的。我们可以看一个例子:

 

首先我们看第2行,要用unordered_map你要先include相应的头文件。
在7行我们定义了一个mymap,它的key是string类型,字符串;value是整形。
第8第9行展示的insert插入,因为我们这里要插入的是一个key/value pair(键值对),我们要用make_pair函数把一个字符串和一个整数打包成一个pair。
第10行是find查找,find返回的也是一个迭代器,iterator。这里我们懒得写很长的迭代器类型,直接用的auto。auto是c++11标准里的关键字,它会自动推断变量的类型。如果你的编译器不支持c++11,那你还是要老老实实写全:unordered_map<string, int>::iterator


迭代器指向的是一个pair,所以第11行我们可以用first和second去拿到对应的key和value,这里first是”c++”这个字符串,second是100这个整数。
第13第14行展示了一下erase删除。

值得一提的是,unordered_map重载了[]运算符,我们可以把key放在中括号里,像操作数组一样操作unordered_map

 

上面这个程序的输出结果是101。大家可以看一下第8~第10行。我们把”c++”这个key放在中括号里就能直接操作”c++”对应的值。这种写法会让程序更直观。

上面我们介绍了unordered_set和unordered_map,它们都有insert/find/erase就是插入/查找/删除函数,时间复杂度都是O(1)。但是要用unordered_set和unordered_map需要编译器支持c++11标准。不支持c++11的话,编译会出错。那如果你面对的评测系统不支持c++11怎么办?那我们不得不退而求其次,用set和map代替。

set需要包含头文件<set>
set::insert
set::find
set::erase
map需要包含头文件<map>
map::insert
map::find
map::erase

set/map的用法和unordered_set/unordered_map的用法完全一样。所以之前我们的3个程序,把unordered_去掉,其他地方不用改,一样可以运行。

set/map不一样的地方是它们内部是用平衡树实现的。所以insert/find/erase操作时间复杂度都是O(logN)的。这里N指容器中有多少个元素。不过O(logN)这个复杂度已经很优秀了,大家可以算一下,如果N=1000000,就是说我这个集合里有100万个元素,logN的值只有20左右。所以它和O(1)也差不了太多。

当然,set和map因为内部实现是平衡树,所以会带来一些额外的好处。它可以用O(logN)的时间复杂度做到一些unordered_set和unordered_map做不到的操作。这个我们后面讲到平衡树再细说。在这几节课程里,我们就当它是不支持c++11时,需要用哈希表的替代方案。

tip:多了解一下set/map/unordered_set/unordered_map的用法,推荐大家一个网站叫cplusplus.com,reference里面有各种详细介绍。

回到本节一开始提到的一类问题:“查找一个元素是不是存在”。现在我们有4件工具来帮我们解决这个问题:
unordered_set  O(1)
unordered_map O(1)
set  O(logN)
map  O(logN)

<think>好的,用户想比较理解C++unordered_mapunordered_set的用法及区别。我需要先回顾这两个容器的基本概念它们的不同之处。根据之前提供的引用内容,记得unordered_map是键值对的哈希表,而unordered_set是唯一元素的哈希集合。它们的内部结构不同,一个是存储键值对,另一个只存储键。 首先,应该从定义用途入手。unordered_map用于需要通过键快速查找值的场景,而unordered_set用于需要快速判断元素是否存在的场景。接下来需要比较它们的头文件、初始化方式、常用操作,比如插入、查找、遍历等。 然后要讨论它们的区别,比如存储内容的不同,是否有序,内存占用,以及性能上的差异。比如,unordered_map的每个元素是pair,而set是单个值。同时,根据引用[4],它们的迭代器类型也不同,一个是单向,另一个可能也是单向?需要确认引用中的内容。引用[4]提到unordered_mapunordered_set使用单向迭代器,而mapset是双向的。这点要明确。 另外,要提到它们的共同点,比如都不排序,都是基于哈希表,查询效率O(1)等。需要引用相关的引用资料,比如引用[5]提到unordered_set基于哈希表,时间复杂度低,但内存消耗多。而unordered_map类似。 用户可能需要代码示例来理解用法。所以需要分别给出unordered_mapunordered_set的代码示例,比如如何插入元素、遍历、查找元素是否存在。根据引用[3]中的例子,可以改编成两个容器的示例,比如展示unordered_map如何存储键值对,set如何插入元素并检查存在性。 还要注意它们的API差异,比如unordered_map使用[]运算符来访问元素,而set没有这样的操作。查找时,map用find返回迭代器,而set的find也是返回迭代器,但元素是单个值。count方法在map中用来检查键是否存在,在set中检查元素是否存在,但通常返回0或1,因为元素唯一。 最后,总结它们的适用场景,比如当需要键值对存储时用unordered_map,当只需要存储唯一元素并快速判断存在性时用unordered_set。同时,比较它们与有序版本(mapset)的区别,比如是否有序、性能差异等,但用户的问题集中在unordered版本,所以重点在两者的对比。 需要确保回答结构清晰,分点说明用法、区别、代码示例,以及相关问题。可能需要检查引用是否正确,比如引用[4]提到它们的迭代器类型实现版本,这些都可以在区别部分引用。</think>### C++ unordered_map vs unordered_set 用法与区别详解 #### 一、核心概念与用途 1. **unordered_map** - 基于哈希表实现,存储$key-value$键值对,提供$O(1)$时间复杂度的查找效率[^4] - 适用于需要快速通过键访问对应值的场景,如缓存系统、词频统计等 2. **unordered_set** - 基于哈希表实现,存储**唯一**元素的集合,提供$O(1)$时间复杂度的成员存在性检查[^5] - 适用于去重操作、集合运算(如交集、并集)等场景 #### 二、代码用法对比 ##### 1. 基本操作示例 ```cpp #include <unordered_map> #include <unordered_set> // unordered_map 示例 void map_demo() { std::unordered_map<std::string, int> word_count; word_count["apple"] = 5; // 插入键值对 word_count.insert({"banana", 3}); if(word_count.find("apple") != word_count.end()) { // 查找键 std::cout << "Apple count: " << word_count["apple"]; // 输出值 } } // unordered_set 示例 void set_demo() { std::unordered_set<int> unique_nums; unique_nums.insert(42); // 插入元素 unique_nums.insert(42); // 重复插入无效 if(unique_nums.count(42) > 0) { // 检查元素存在性 std::cout << "42 exists"; } } ``` ##### 2. 遍历方式差异 ```cpp // unordered_map遍历键值对 for(auto& pair : word_count) { std::cout << pair.first << ": " << pair.second << std::endl; // 输出键值 } // unordered_set遍历元素 for(auto& num : unique_nums) { std::cout << num << std::endl; // 直接输出元素值 } ``` #### 三、核心区别总结 | 特性 | unordered_map | unordered_set | |---------------------|------------------------|------------------------| | **存储内容** | 键值对(pair) | 单个元素 | | **元素访问** | 支持[]运算符 | 无[]访问 | | **内存占用** | 较高(需存储键值对) | 较低 | | **典型操作** | find(key)/count(key) | find(value)/count(value) | | **迭代器解引用结果**| pair类型 | 直接元素值 | | **数据冗余** | 允许值重复,键唯一 | 元素完全唯一 | #### 四、选择依据 1. 需要建立**映射关系**时选择`unordered_map`(如电话簿) 2. 需要**快速存在性检查**时选择`unordered_set`(如敏感词过滤) 3. 需要保证元素有序时选择有序版本`map/set`(时间复杂度升至$O(\log n)$)[^4] #### 五、性能注意事项 - 两者插入/查找平均时间复杂度为$O(1)$,但最坏情况(哈希冲突严重)可能退化为$O(n)$ - 可通过`load_factor()``rehash()`优化哈希表性能[^3] - unordered系列容器遍历顺序不可预测,与插入顺序无关[^2]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值