关联容器-set和multiset集合

owde

已于 2025-04-10 14:30:34 修改

阅读量1k

点赞数 13

文章标签： c++ 数据结构开发语言

于 2025-04-08 10:46:18 首次发布

本文链接：https://blog.youkuaiyun.com/2301_76411812/article/details/147061372

版权

关联容器

关联容器和顺序容器有着根本的不同:关联容器中的元素是按关键字来保存和访问的,而顺序容器中的元素是按它们在容器中的位置来顺序保存和访问的。

关联容器支持高效的关键字查找和访问。

两个主要的关联容器(associative-container),set和map。

set 中每个元素只包含一个关键字。set 支持高效的关键字查询操作一一检查一个给定关键字是否在 set 中。

map 的元素是关键字-值 (key-value)对(也称键-值对)。其中关键字起到索引的作用，值则表示与索引相关联的数据。字典是一个很好的使用 map 的例子:可以将单词作为关键字，将单词释义作为值。

标准库针对set和map一共提供8种不同的关联容器。1.是否运行关键字重复;2.是否按顺序保存元素

set和multiset定义在头文件set中;map和multimap定义在头文件map中;无序容器则定义在头文件unordered set和unordered map中。

set和multiset集合

set和multiset会根据特定的排序准则，自动将元素排序。两者不同之处在于multiset 允许元素重复而 set 不允许。如下图:

使用set或multiset，必须先包含头文件<set>:

#include <set>

上述两个类型都被定义为命名空间std内的class template:

namespace std {
    template <typename T,
    typename Compare = less<T>,
    typename Allocator = allocator<T> >
    class set;

    template <typename T,
    typename Compare = less<T>,1
    typename Allocator = allocator<T> >
    class multiset;
}

其中T是能进行排序的数据类型。第二个参数是进行排序的规则,默认为升序(小于,<),第三个是内存分配器,不用管。

set 和multiset通常用平衡二叉树(balanced binary tree,确切说是红黑树)实现。这样在插入数据时能自动排序,使得查找元素时有良好性能。其查找函数具有对数O(logn)时间复杂度。

但是,自动排序也造成set和multiset的一个重要限制:你不能直接改变元素值，因为这样会打乱原本正确的顺序。

从其接口也能反映这种情况:

set和multiset不提供任何函数可以直接访问元素。

通过迭代器访问元素时都是常量。

定义及初始化

set的定义和初始化如下:

#include <set>
#include <iostream>
using namespace std;

//输出s(升序)的所有数据
void Show(const set<int>& s)
{
    for (auto i : s)
        cout << i << " ";
    cout << endl;
}

//输出s(降序)的所有数据
void Show(const set<int,greater<int>>&s)
{
    for (auto i : s)
        cout << i << " ";
    cout << endl;
}

int main()
{
    set <int> s0;//创建一个空的int set集合
    s0.insert(5); //插入数据
    s0.insert(3);
    s0.insert(1);
    s0.insert(2);
    s0.insert(4);
    s0.insert(4);//相同数据插入失败

    set <int> s1(s0); //利用原来的set对象,创建一个新的set对象
    set <int> s2 = s1;//同上
    set <int> s3(s0.begin(), --s0.end());//利用迭代器创建一个新的set对象
    set <int> s4{  1, 6, 3, 5, 4, 2  };//利用初始化列表创建一个set对象,可以无序

    cout << "s0:"; Show(s0); //输出数据
    cout << "s1:"; Show(s1);
    cout << "s2:"; Show(s2);
    cout << "s3:"; Show(s3);
    cout << "s4:"; Show(s4);

    cout << "降序的集合" << endl;
    set <int, greater<int> > s5; //创建一个降序的set集合
    s5.insert(10);//插入数据
    s5.insert(40);
    s5.insert(30);
    s5.insert(20);
    cout << "s5:"; Show(s5);//输出数据

    return 0;
}

multiset定义和初始化如下:

#include <set>
#include <iostream>
using namespace std;

//输出s(升序)的所有数据
void Show(const multiset<int>& s)
{
    for (auto i : s)
        cout << i << " ";
    cout << endl;
}

//输出s(降序)的所有数据
void Show(const multiset<int, greater<int>>& s)
{
    for (auto i : s)
        cout << i << " ";
    cout << endl;
}

int main()
{
    multiset <int> s0;//创建一个空的int set集合
    s0.insert(5); //插入数据
    s0.insert(3);
    s0.insert(1);
    s0.insert(2);
    s0.insert(4);
    s0.insert(4);//可以插入相同数据

    multiset <int> s1(s0); //利用原来的set对象,创建一个新的set对象
    multiset <int> s2 = s1;//同上
    multiset <int> s3(s0.begin(), --s0.end());//利用迭代器创建一个新的set对象
    multiset <int> s4{ { 1, 6, 3, 5, 4, 2 } };//利用初始化列表创建一个set对象

    cout << "s0:"; Show(s0); //输出数据
    cout << "s1:"; Show(s1);
    cout << "s2:"; Show(s2);
    cout << "s3:"; Show(s3);
    cout << "s4:"; Show(s4);

    cout << "降序的集合" << endl;
    multiset <int, greater<int> > s5; //创建一个降序的set集合
    s5.insert(10);//插入数据
    s5.insert(40);
    s5.insert(30);
    s5.insert(20);
    cout << "s5:"; Show(s5);//输出数据

    return 0;
}

说明:multiset可以存放相同的元素。

特性

set 集合

唯一性：set中的元素是唯一的，当尝试插入一个已经存在于set中的元素时，插入操作将被忽略，不会产生重复元素。这一特性在数据去重方面极为便捷，比如在处理大量日志数据时，需要统计出现过的不同 IP 地址，使用set可以轻松实现去重。
自动排序：set会自动根据元素的比较规则（默认为小于运算符<）对元素进行排序。这意味着，在遍历set时，元素将按照升序依次输出。例如，在一个存储整数的set中，插入元素5、3、8后，遍历set会得到3、5、8的顺序。

multiset 集合

允许重复元素：这是multiset与set的主要区别。在multiset中，可以插入多个相同的元素，每个元素都会被正确存储和排序。例如，在一个存储单词出现次数的系统中，如果需要记录每个单词在文本中出现的所有位置，multiset可以方便地存储这些重复的位置信息。
自动排序：与set一样，multiset会根据元素的比较规则（默认为小于运算符<）自动对元素进行排序。这使得在查找和遍历multiset时，元素按照有序的方式呈现。例如，在一个存储员工年龄的multiset中，即使有多个员工年龄相同，遍历multiset时，年龄也会按照从小到大的顺序依次输出。

添加元素和删除元素

通过insert函数插入数据。通过erase删除元素。

注意对于插入insert函数,其返回值有区别。

返回类型之所以不相同，原因是: multiset 允许元素重复而 set 不允许。因此，如果将某元素插入到 set 内，而该 set 已经包含该元素，插入数据将失败。所以set 的返回类型是以pair组织起来的两个值,pair结构中的first成员表示新元素的位置，second成员表示是否插入成功。

对于插入多个值的情况,返回值没有实际意义也就不返回了(void)。

//输出s(升序)的所有数据
void Show(const set<int>& s)
{
    for (auto i : s)
        cout << i << " ";
    cout << endl;
}

//输出s(升序)的所有数据
void Show(const multiset<int>& s)
{
    for (auto i : s)
        cout << i << " ";
    cout << endl;
}

int main()
{
    set<int> s1;
    s1.insert(4);
    s1.insert(1);
    s1.insert(5);
    s1.insert(2);
    cout << "s1:";  Show(s1);

    auto p = s1.insert(5);
    if (p.second)
        cout << "往s1插入5成功" << endl;
    else
        cout << "往s1插入5失败" << endl;
    cout << endl;

    multiset<int> s2;
    s2.insert(3);
    s2.insert(7);
    s2.insert(5);
    s2.insert(1);
    cout << "s2:";  Show(s2);
    s2.insert(5);
    cout << "往s2插入5后" << endl;
    cout << "s2:";  Show(s2);

    return 0;
}

常用迭代器

set和multiset支持双向迭代器,不支持随机迭代器,可以往前和往后,但不能+1,-1(这是随机迭代器)等。常用的迭代器如下:

set和multiset常用的运算符

set和multiset类既支持常用的=,==,!=,< , >等运算符,也可以通过调用其成员函数来执行相应的操作。下面列举了其常用的操作。

//输出s(升序)的所有数据
void Show(const set<int>& s)
{
    for (auto i : s)
        cout << i << " ";
    cout << endl;
}

int main()
{
    set<int> s1;
    s1.insert(4);
    s1.insert(1);
    s1.insert(5);
    s1.insert(2);
    cout << "s1:";  Show(s1);

    set<int> s2;
    s2 = s1;
    cout << "s2:";  Show(s2);
    if (s1 == s2)
        cout << "s1 == s2" << endl;
    s2.insert(7);
    cout << "往s2插入7后,";
    if (s1 > s2)
        cout << "s1 > s2";
    else if (s1 < s2)
        cout << "s1 < s2";

    //cout << s1[1] << endl;//错误

    return 0;
}

set和multiset常用成员函数

下面列举set和multiset对象常用的成员函数

例子：

int main()
{
    set<int>s1{ 1,4,2,3,2 };        //有一个重复的2不能添加 
    multiset<int>s2{ 1,4,2,3,2 };//有一个重复的2可以添加 
    cout << "s1元素个数:" << s1.size() << endl;
    cout << "s2元素个数:" << s2.size() << endl;

    cout << "s1中2的个数:" << s1.count(2) << endl;
    cout << "s2中2的个数:" << s2.count(2) << endl;

    if (s1.empty())
        cout << "s1是空的" << endl;
    else
        cout << "s1不是空的" << endl;

    int key = 2;
    if (s1.find(key) != s1.end())//成功返回元素的迭代器,失败返回尾后迭代器
        cout << key << "在集合中" << endl;
    else
        cout << key << "不在集合中" << endl;

    s1.clear();
    s2.clear();
    cout << "调用clear函数后" << endl;
    cout << "s1元素个数:" << s1.size() << endl;
    cout << "s2元素个数:" << s2.size() << endl;

    if (s1.empty())
        cout << "s1是空的";
    else
        cout << "s1不是空的";

    return 0;
}

set应用场景

set在C++中是一个内部自动有序且不含重复元素的容器，它的应用场景广泛且多样。以下是一些set的常见应用场景：

1.去重操作

当需要从一个数据集合中去除重复元素时，set是一个很好的选择。由于其不允许存储重复的元素，因此可以很容易地实现去重功能。这在处理原始数据或进行数据分析时特别有用。题目：给定一个字符串数组 words，请返回一个由 words 中所有不重复单词组成的列表，并按字母顺序排序。

示例：

输入：words = ["apple", "banana", "apple", "orange", "banana", "kiwi"]

输出：["apple", "banana", "kiwi", "orange"]

解释：去重后并按字母顺序排序得到的单词列表是 ["apple", "banana", "kiwi", "orange"]。

解题思路：

创建一个空的 set 对象，用于存储不重复的单词。
遍历字符串数组 words，将每个单词插入到 set 中。由于 set 会自动去重，并对单词排序。
将 set 中的单词转换为一个 vector 对象。
返回排序后的 vector 对象作为最终结果。

#include <iostream>  
#include <vector>  
#include <set>   
#include <string>  
using namespace std;

void UniqueWords(vector<string>& v) {
	set<string> s(v.begin(), v.end());        // 利用set去重并自动排序  
	v = vector<string>{ s.begin(), s.end() }; // 将set中的单词复制到v中  
}

int main() {
	vector<string> v = { "apple", "banana", "apple", "orange", "banana", "kiwi" };
	UniqueWords(v);

	for (const auto& x : v) { //显示结果
		cout << x << " ";
	}
	cout << endl;

	return 0;
}

2.自动排序

如果需要对元素保持持续的排序状态，如维持一个按字母顺序排列的单词列表、存储并维护一个按年龄升序或降序排列的人口数据库等，std::set 可以实现这一功能。每次插入新元素，容器都会自动调整元素的顺序。当然如果仅仅是排序,可以使用sort函数进行排序. sort排序是在排序瞬间的,如果又插入新的数据可能不再有序 set的有序是持续的,不管插入还是删除数据它始终有序

3.快速查找

由于set内部采用了高效的平衡查找二叉树（如红黑树），因此它提供快速的查找性能。包括检查元素是否已存在（.count() 或 .find()或.equal_range()）、查找特定值的下一个/前一个元素（迭代器操作）。这对于实现诸如查找词汇表中的下一个更大词、或者在游戏中查找排名高于当前玩家的下一个玩家等场景很有用。

总结

set和multiset作为 C++ 标准库中强大的关联容器，各自以独特的特性在编程领域中占据重要地位。set通过唯一性和自动排序为数据去重、排序和快速查找提供了高效解决方案；multiset则凭借允许重复元素的特性，在统计元素出现次数等场景中发挥关键作用。深入理解它们的概念、特性、操作以及内部实现，能够帮助我们在面对各种编程任务时，准确选择合适的数据结构，编写出更加高效、优雅的代码。无论是在算法设计、数据处理还是系统开发中，set和multiset都将是我们得力的编程工具，助力我们在 C++ 的编程世界中不断探索前行。