unordered_map和unordered_set的使⽤

1. unordered_set系列的使⽤

1.1 unordered_set和unordered_multiset参考⽂档

https://legacy.cplusplus.com/reference/unordered_set/

1.2 unordered_set类的介绍

• unordered_set的声明如下,Key就是unordered_set底层关键字的类型。
• unordered_set默认 要求Key⽀持转换为整形 ,如果不⽀持或者想按⾃⼰的需求⾛可以⾃⾏实现⽀
持将Key转成整形的仿函数传给第⼆个模板参数
• unordered_set默认 要求Key⽀持⽐较相等 ,如果不⽀持或者想按⾃⼰的需求⾛可以⾃⾏实现⽀持
将Key⽐较相等的仿函数传给第三个模板参数
• unordered_set底层存储数据的内存是从空间配置器申请的,如果需要可以⾃⼰实现内存池,传给
第四个参数。
• ⼀般情况下,我们都不需要传后三个模板参数。
• unordered_set底层是⽤哈希桶实现, 增删查平均效率是O(1) 迭代器遍历不再有序,为了跟set
区分,所以取名unordered_set。
• 前⾯部分我们已经学习了set容器的使⽤,set和unordered_set的功能⾼度相似,只是底层结构不
同,有⼀些性能和使⽤的差异,这⾥我们只讲他们的差异部分。

1.3 unordered_set和set的使⽤差异

查看⽂档我们会发现unordered_set的⽀持增删查且跟set的使⽤⼀模⼀样,关于使用我们这⾥就不再赘述和演示了。
unordered_set和set的第⼀个差异是对key的要求不同,set要求Key⽀持⼩于⽐较,但是
unordered_set要求Key⽀持转成整形且⽀持等于⽐较,要理解unordered_set的这个两点要求得
后续我们结合哈希表底层实现才能真正理解,也就是说这本质是哈希表的要求
unordered_set和set的第⼆个差异是迭代器的差异,set的iterator是双向迭代器,unordered_set  是单向迭代器,其次set底层是红⿊树,红⿊树是⼆叉搜索树,⾛中序遍历是有序的,所以set迭代器遍历是有序+去重。⽽unordered_set底层是哈希表,迭代器遍历是⽆序+去重
unordered_set和set的第三个差异是性能的差异,整体而言⼤多数场景下,unordered_set的增删
查改更快⼀些,因为红黑树增删查改效率是O ( logN),而哈希表增删查平均效率是O (1),具体 可以参看下面代码的演示的对比差异。
#define _CRT_SECURE_NO_WARNINGS 1

#include<iostream>
#include<set>
#include<unordered_set>

using namespace std;

void test_set1()
{
	unordered_set<int> s = { 3,1,6,7,8,2,1,1,5,6,7,6 };
	unordered_set<int>::iterator it = s.begin();
	while (it != s.end())
	{
		cout << *it << " ";
		++it;
	}
	cout << endl;
}

void test_set2()
{
	const size_t N = 10000000;
	unordered_set<int> us;
	set<int> s;
	vector<int> v;
	v.reserve(N);
	srand(time(0));
	for (size_t i = 0; i < N; ++i)
	{
		//v.push_back(rand()); // N比较大时,重复值比较多
		//v.push_back(rand() + i); // 重复值相对少
		v.push_back(i); // 没有重复,有序
	}

	size_t begin1 = clock();
	for (auto e : v)
	{
		s.insert(e);
	}
	size_t end1 = clock();
	cout << "set insert:" << end1 - begin1 << endl;

	size_t begin2 = clock();
	us.reserve(N);
	for (auto e : v)
	{
		us.insert(e);
	}
	size_t end2 = clock();
	cout << "unordered_set insert:" << end2 - begin2 << endl;

	cout << "插入数据个数:" << s.size() << endl;
	cout << "插入数据个数:" << us.size() << endl << endl;

	int m1 = 0;
	size_t begin3 = clock();
	for (auto e : v)
	{
		auto ret = s.find(e);
		if (ret != s.end())
		{
			++m1;
		}
	}
	size_t end3 = clock();
	cout << "set find:" << end3 - begin3 << "->" << m1 << endl;

	int m2 = 0;
	size_t begin4 = clock();
	for (auto e : v)
	{
		auto ret = us.find(e);
		if (ret != us.end())
		{
			++m2;
		}
	}
	size_t end4 = clock();
	cout << "unorered_set find:" << end4 - begin4 << "->" << m2 << endl;

	size_t begin5 = clock();
	for (auto e : v)
	{
		s.erase(e);
	}
	size_t end5 = clock();
	cout << "set erase:" << end5 - begin5 << endl;
	size_t begin6 = clock();

	for (auto e : v)
	{
		us.erase(e);
	}
	size_t end6 = clock();
	cout << "unordered_set erase:" << end6 - begin6 << endl << endl;
}

int main()
{
	test_set2();
	return 0;
}

1.4 unordered_map和map的使⽤差异

查看⽂档我们会发现unordered_map的⽀持增删查改且跟map的使⽤⼀模⼀样,关于使用我们这
⾥就不再赘述和演示了。
unordered_map和map的第⼀个差异是对key的要求不同, map要求Key⽀持⼩于⽐较 ,⽽
unordered_map 要求Key⽀持转成整形且⽀持等于⽐较 ,要理解unordered_map的这个两点要求
得后续我们结合哈希表底层实现才能真正理解,也就是说这本质是哈希表的要求。
unordered_map和map的第⼆个差异是迭代器的差异,map的iterator是双向迭代器,
unordered_map是单向迭代器,其次map底层是红⿊树,红⿊树是⼆叉搜索树,⾛中序遍历是有
序的,所以map迭代器遍历是Key有序+去重。⽽unordered_map底层是哈希表,迭代器遍历是
Key⽆序+去重
unordered_map和map的第三个差异是性能的差异,整体⽽⾔⼤多数场景下,unordered_map的
增删查改更快⼀些,因为红⿊树增删查改效率是O ( logN ),⽽哈希表增删查平均效率是O(1 )。
pair<iterator,bool> insert ( const value_type& val );
size_type erase ( const key_type& k );
iterator find ( const key_type& k );
mapped_type& operator[] ( const key_type& k );

1.5 unordered_multimap/unordered_multiset

unordered_multimap/unordered_multiset跟multimap/multiset功能完全类似,⽀持Key冗余。
unordered_multimap/unordered_multiset跟multimap/multiset的差异也是三个⽅⾯的差异,
key的要求的差异,iterator及遍历顺序的差异,性能的差异。

                           

<think>好的,用户想比较理解C++中unordered_mapunordered_set的用法及区别。我需要先回顾这两个容器的基本概念它们的不同之处。根据之前提供的引用内容,记得unordered_map是键值对的哈希表,而unordered_set是唯一元素的哈希集合。它们的内部结构不同,一个是存储键值对,另一个只存储键。 首先,应该从定义用途入手。unordered_map用于需要通过键快速查找值的场景,而unordered_set用于需要快速判断元素是否存在的场景。接下来需要比较它们的头文件、初始化方式、常用操作,比如插入、查找、遍历等。 然后要讨论它们的区别,比如存储内容的不同,是否有序,内存占用,以及性能上的差异。比如,unordered_map的每个元素是pair,而set是单个值。同时,根据引用[4],它们的迭代器类型也不同,一个是单向,另一个可能也是单向?需要确认引用中的内容。引用[4]提到unordered_mapunordered_set使用单向迭代器,而mapset是双向的。这点要明确。 另外,要提到它们的共同点,比如都不排序,都是基于哈希表,查询效率O(1)等。需要引用相关的引用资料,比如引用[5]提到unordered_set基于哈希表,时间复杂度低,但内存消耗多。而unordered_map类似。 用户可能需要代码示例来理解用法。所以需要分别给出unordered_mapunordered_set的代码示例,比如如何插入元素、遍历、查找元素是否存在。根据引用[3]中的例子,可以改编成两个容器的示例,比如展示unordered_map如何存储键值对,set如何插入元素并检查存在性。 还要注意它们的API差异,比如unordered_map使用[]运算符来访问元素,而set没有这样的操作。查找时,map用find返回迭代器,而set的find也是返回迭代器,但元素是单个值。count方法在map中用来检查键是否存在,在set中检查元素是否存在,但通常返回0或1,因为元素唯一。 最后,总结它们的适用场景,比如当需要键值对存储时用unordered_map,当只需要存储唯一元素并快速判断存在性时用unordered_set。同时,比较它们与有序版本(mapset)的区别,比如是否有序、性能差异等,但用户的问题集中在unordered版本,所以重点在两者的对比。 需要确保回答结构清晰,分点说明用法、区别、代码示例,以及相关问题。可能需要检查引用是否正确,比如引用[4]提到它们的迭代器类型实现版本,这些都可以在区别部分引用。</think>### C++ unordered_map vs unordered_set 用法与区别详解 #### 一、核心概念与用途 1. **unordered_map** - 基于哈希表实现,存储$key-value$键值对,提供$O(1)$时间复杂度的查找效率[^4] - 适用于需要快速通过键访问对应值的场景,如缓存系统、词频统计等 2. **unordered_set** - 基于哈希表实现,存储**唯一**元素的集合,提供$O(1)$时间复杂度的成员存在性检查[^5] - 适用于去重操作、集合运算(如交集、并集)等场景 #### 二、代码用法对比 ##### 1. 基本操作示例 ```cpp #include <unordered_map> #include <unordered_set> // unordered_map 示例 void map_demo() { std::unordered_map<std::string, int> word_count; word_count["apple"] = 5; // 插入键值对 word_count.insert({"banana", 3}); if(word_count.find("apple") != word_count.end()) { // 查找键 std::cout << "Apple count: " << word_count["apple"]; // 输出值 } } // unordered_set 示例 void set_demo() { std::unordered_set<int> unique_nums; unique_nums.insert(42); // 插入元素 unique_nums.insert(42); // 重复插入无效 if(unique_nums.count(42) > 0) { // 检查元素存在性 std::cout << "42 exists"; } } ``` ##### 2. 遍历方式差异 ```cpp // unordered_map遍历键值对 for(auto& pair : word_count) { std::cout << pair.first << ": " << pair.second << std::endl; // 输出键值 } // unordered_set遍历元素 for(auto& num : unique_nums) { std::cout << num << std::endl; // 直接输出元素值 } ``` #### 三、核心区别总结 | 特性 | unordered_map | unordered_set | |---------------------|------------------------|------------------------| | **存储内容** | 键值对(pair) | 单个元素 | | **元素访问** | 支持[]运算符 | 无[]访问 | | **内存占用** | 较高(需存储键值对) | 较低 | | **典型操作** | find(key)/count(key) | find(value)/count(value) | | **迭代器解引用结果**| pair类型 | 直接元素值 | | **数据冗余** | 允许值重复,键唯一 | 元素完全唯一 | #### 四、选择依据 1. 需要建立**映射关系**时选择`unordered_map`(如电话簿) 2. 需要**快速存在性检查**时选择`unordered_set`(如敏感词过滤) 3. 需要保证元素有序时选择有序版本`map/set`(时间复杂度升至$O(\log n)$)[^4] #### 五、性能注意事项 - 两者插入/查找平均时间复杂度为$O(1)$,但最坏情况(哈希冲突严重)可能退化为$O(n)$ - 可通过`load_factor()``rehash()`优化哈希表性能[^3] - unordered系列容器遍历顺序不可预测,与插入顺序无关[^2]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值