深入剖析C++ STL中的set:高效管理有序数据的利器

前言:在 C++ 标准模板库(STL)中,set是一个常用的关联容器,用于存储唯一的、自动排序的数据。它是解决去重、有序存储、快速查找等问题的绝佳工具。本文将深入探讨 set 的特性、用法及其在实际开发中的应用场景。

什么是 set?
set 是 C++ STL 提供的一个模板类,基于红黑树实现,具有以下核心特性:
元素唯一:set 会自动去重,插入相同的元素时,新元素会被忽略。
自动排序:默认情况下,set 按照升序排列元素,也可以通过自定义比较器实现自定义排序。
高效操作:常见操作如插入、删除、查找的时间复杂度为 𝑂(log𝑛)。

set和multiset参考文档

set的库函数的使用

set类的介绍

template < class T,                        // set::key_type/value_type
           class Compare = less<T>,        //set::key_compare/value_compare
           class Alloc = allocator<T>      // set::allocator_type
           > class set;
  • set的声明如下,T就是set底层关键字的类型
  • set默认要求T支持小于比较,如果不⽀持或者想按⾃⼰的需求⾛可以⾃⾏实现仿函数传给第⼆个模版参数
  • set底层存储数据的内存是从空间配置器申请的,如果需要可以⾃⼰实现内存池,传给第三个参数。
  • 一般情况下,我们都不需要传后两个模版参数。
  • set底层是⽤红⿊树实现,增删查效率是 ,迭代器遍历是⾛的搜索树的中序,所以是有序的。O(logN)
  • 前⾯部分我们已经学习了vector/list等容器的使⽤,STL容器接口设计,高度相似,所以这⾥我们就不再⼀个接口⼀个接口的介绍。可以看作者之前的文章。

set的构造和迭代器

set的构造我们关注以下几个接口即可。
set的支持正向和反向迭代遍历,遍历默认按升序顺序,因为底层是⼆叉搜索树,迭代器遍历⾛的中序;⽀持迭代器就意味着支持范围for,set的iterator和const_iterator都不支持迭代器修改数据,修改关键字数据,破坏了底层搜索树的结构。

// empty (1) ⽆参默认构造
explicit set (const key_compare& comp = key_compare(),
const allocator_type& alloc = allocator_type());

// range (2) 迭代器区间构造
template <class InputIterator>
set (InputIterator first, InputIterator last,
	const key_compare& comp = key_compare(),
	const allocator_type& = allocator_type());
	
// copy (3) 拷⻉构造
set (const set& x);

// initializer list (5) initializer 列表构造
set (initializer_list<value_type> il,
	const key_compare& comp = key_compare(),
	const allocator_type& alloc = allocator_type());
	
// 迭代器是⼀个双向迭代器
iterator -> a bidirectional iterator to const value_type

// 正向迭代器
iterator begin();
iterator end();

// 反向迭代器
reverse_iterator rbegin();
reverse_iterator rend();

常见成员函数解析

成员函数功能描述
insert(val)插入值为 val 的元素,若已存在则不插入。
erase(val)删除值为 val 的元素,若不存在则无操作。
find(val)查找值为 val 的元素,返回迭代器;若未找到,返回 end()。
size()返回当前元素个数。
empty()判断容器是否为空。
clear()清空所有元素。

set的增删查

set的增删查关注以下几个接口即可:

Member types
key_type -> The first template parameter (T)
value_type -> The first template parameter (T)

// 单个数据插⼊,如果已经存在则插⼊失败
pair<iterator,bool> insert (const value_type& val);

// 列表插⼊,已经在容器中存在的值不会插⼊
void insert (initializer_list<value_type> il);

// 迭代器区间插⼊,已经在容器中存在的值不会插⼊
template <class InputIterator>
void insert (InputIterator first, InputIterator last);

// 查找val,返回val所在的迭代器,没有找到返回end()
iterator find (const value_type& val);

// 查找val,返回Val的个数
size_type count (const value_type& val) const;

// 删除⼀个迭代器位置的值
iterator erase (const_iterator position);

// 删除val,val不存在返回0,存在返回1
size_type erase (const value_type& val);

// 删除⼀段迭代器区间的值
iterator erase (const_iterator first, const_iterator last);

// 返回⼤于等于val位置的迭代器
iterator lower_bound (const value_type& val) const;

// 返回⼤于val位置的迭代器
iterator upper_bound (const value_type& val) const;

set与其他容器对比

在这里插入图片描述

insert和迭代器遍历使⽤样例:

#include<iostream>
#include<set>
using namespace std;
int main()
{
	// 去重+升序排序
	set<int> s;
	// 去重+降序排序(给⼀个⼤于的仿函数)
	//set<int, greater<int>> s;
	s.insert(5);
	s.insert(2);
	s.insert(7);
	s.insert(5);
	//set<int>::iterator it = s.begin();
	auto it = s.begin();
	while (it != s.end())
	{
		// error C3892: “it”: 不能给常量赋值
		// *it = 1;
		cout << *it << " ";
		++it;
	}
	cout << endl;
	// 插⼊⼀段initializer_list列表值,已经存在的值插⼊失败
	s.insert({ 2,8,3,9 });
	for (auto e : s)
	{
		cout << e << " ";
	}
	cout << endl;
	set<string> strset = { "sort", "insert", "add" };
	// 遍历string⽐较ascll码⼤⼩顺序遍历的
	for (auto& e : strset)
	{
		cout << e << " ";
	}
	cout << endl;
}

multiset和set的差异

multiset和set的使⽤基本完全类似,主要区别点在于multiset⽀持值冗余,那么insert/find/count/erase都围绕着⽀持值冗余有所差异,具体参看下⾯的样例代码理解。

#include<iostream>
#include<set>
using namespace std;
int main()
{
	// 相⽐set不同的是,multiset是排序,但是不去重
	multiset<int> s = { 4,2,7,2,4,8,4,5,4,9 };
	auto it = s.begin();
	while (it != s.end())
	{
		cout << *it << " ";
		++it;
	}
	cout << endl;
	// 相⽐set不同的是,x可能会存在多个,find查找中序的第⼀个
	int x;
	cin >> x;
	auto pos = s.find(x);
	while (pos != s.end() && *pos == x)
	{
		cout << *pos << " ";
		++pos;
	}
	cout << endl;
	// 相⽐set不同的是,count会返回x的实际个数
	cout << s.count(x) << endl;
	// 相⽐set不同的是,erase给值时会删除所有的x
	s.erase(x);
	for (auto e : s)
	{
		cout << e << " ";
	}
	cout << endl;
	return 0;
}

两个数组的交集

class Solution 
{
public:
    vector<int> intersection(vector<int>& nums1, vector<int>& nums2) 
    {
        // 将 nums1 的元素存入一个 set,自动去重并排序
        set<int> s1(nums1.begin(), nums1.end());
        // 将 nums2 的元素存入另一个 set,自动去重并排序
        set<int> s2(nums2.begin(), nums2.end());

        // 用于存储交集结果的 vector
        vector<int> ret;
        
        // 定义两个迭代器分别指向 s1 和 s2 的起始位置
        auto it1 = s1.begin();
        auto it2 = s2.begin();

        // 使用双指针遍历两个有序集合,寻找交集
        while(it1 != s1.end() && it2 != s2.end())
        {
            // 如果当前 s1 的元素小于 s2 的元素,则移动 s1 的迭代器
            if(*it1 < *it2)
            {
                it1++;
            }
            // 如果当前 s2 的元素小于 s1 的元素,则移动 s2 的迭代器
            else if(*it2 < *it1)
            {
                it2++;
            }
            // 如果 s1 和 s2 的当前元素相等,将其加入结果并同时移动两个迭代器
            else
            {
                ret.push_back(*it1); // 将交集元素加入结果
                it1++;
                it2++;
            }
        }

        // 返回交集结果
        return ret;
    }
};

环形链表||

class Solution 
{
public:
    ListNode *detectCycle(ListNode *head) 
    {
        // 使用 set 存储已经访问过的节点
        set<ListNode*> s;
        // 定义一个指针从链表头部开始遍历
        ListNode* cur = head;

        // 遍历链表
        while (cur)
        {
            // 尝试将当前节点插入 set 中
            auto ret = s.insert(cur);
            // 如果插入失败,说明当前节点已经存在于 set 中,检测到环
            if (ret.second == false)
                return cur; // 返回环的起始节点
            // 向下移动指针
            cur = cur->next;
        }

        // 如果遍历结束仍未检测到环,则返回 nullptr 表示无环
        return nullptr;
    }
};

评论 27
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值