95 常用 集合算法 set_intersection set_union set_difference

本文详细介绍了C++中STL库中的三个集合操作算法:set_intersection(交集)、set_union(并集)和set_difference(差集)。通过示例展示了如何使用这些算法操作整数向量。
#include <iostream>
#include <vector>
#include <algorithm>


using namespace std;

//stl常见算法
/*
1.algorithm
2.numeric
3.functional
*/


void mprint(int val)
{
	cout << val << "  ";
}

//常用 集合算法 set_intersection set_union set_difference
//内置数据类型

//交集 set_intersection
void test01()
{
	vector<int>v1,v2;
	for (int i = 1; i < 10; i++)
	{
		v1.push_back(i);
		v2.push_back(i+5);
	}
	for_each(v1.begin(), v1.end(), mprint);//1  2  3  4  5  6  7  8  9
	cout << endl;

	for_each(v2.begin(), v2.end(), mprint);//6  7  8  9  10  11  12  13  14
	cout << endl;

	vector<int>vTarget;
	vTarget.resize(min(v1.size(), v2.size()));

	vector<int>::iterator endit = set_intersection(v1.begin(), v1.end(), v2.begin(), v2.end(), vTarget.begin());  //endit 终止的 迭代器。 vTarget 的size 一般会大于 endit
	for_each(vTarget.begin(), endit, mprint);//6  7  8  9
	cout << endl;	
}

//set_union 并集
void test02()
{
	vector<int>v1, v2;
	for (int i = 1; i < 10; i++)
	{
		v1.push_back(i);
		v2.push_back(i + 5);
	}
	for_each(v1.begin(), v1.end(), mprint);//1  2  3  4  5  6  7  8  9
	cout << endl;

	for_each(v2.begin(), v2.end(), mprint);//6  7  8  9  10  11  12  13  14
	cout << endl;

	vector<int>vTarget;
	vTarget.resize(v1.size()+v2.size());

	vector<int>::iterator endit = set_union(v1.begin(), v1.end(), v2.begin(), v2.end(), vTarget.begin());
	for_each(vTarget.begin(), endit, mprint);//1  2  3  4  5  6  7  8  9  10  11  12  13  14
	cout << endl;
}


//set_difference 差集
void test03()
{
	vector<int>v1, v2;
	for (int i = 1; i < 10; i++)
	{
		v1.push_back(i);
		v2.push_back(i + 5);
	}
	for_each(v1.begin(), v1.end(), mprint);//1  2  3  4  5  6  7  8  9
	cout << endl;

	for_each(v2.begin(), v2.end(), mprint);//6  7  8  9  10  11  12  13  14
	cout << endl;

	// 求v1和v2 的差集, 在v1中,不存在v2 中
	vector<int>vTarget;
	vTarget.resize(max(v1.size(),v2.size()));

	vector<int>::iterator endit = set_difference(v1.begin(), v1.end(), v2.begin(), v2.end(), vTarget.begin());  
	for_each(vTarget.begin(), endit, mprint);//1  2  3  4  5
	cout << endl;


	// 求v2和v1 的差集, 在v2中,不存在v1 中
	vector<int>vTarget1;
	vTarget1.resize(max(v1.size(), v2.size()));

	endit = set_difference(v2.begin(), v2.end(), v1.begin(), v1.end(), vTarget1.begin());  // 求v1和v2 的差集, 在v1中,不存在v2 中
	for_each(vTarget1.begin(), endit, mprint);//10  11  12  13  14
	cout << endl;

}

int main()
{
	test01();
	cout << "+++++++++++++++++++++" << endl;
	test02();
	cout << "+++++++++++++++++++++" << endl;
	test03();
	system("pause");
	return 0;
}
<think> 首先,用户的问题是关于C++中的set_intersection。他们想了解其使用方法、示例和原理等。我会基于系统指令和提供的引用来构建回答。 系统指令关键点: - 所有行内数学表达式用$...$,例如$A \cap B$。 - 独立公式用$$...$$并单独成段。 - LaTeX语法正确。 - 使用中文回答。 - 生成相关问题。 - 回答中引用的段落末尾自然地添加引用标识,如[^1]。 提供的引用: - [^1] 提到accumulate、fill和集合算法,包括set_intersection等。 - [^2] 强调使用set_intersection时需包含头文件、目标容器提前开辟内存空间、容器必须有序且一致等。 - [^3] 给出了函数原型。 - [^4] 是C++17版本的set_intersection。 - [^5] 解释了集合操作的概念(并集、交集、差集),并给出了函数原型。 用户具体查询:set_intersection的使用方法及示例。 我的回答结构: 1. **介绍set_intersection的功能**:解释它是用来计算两个有序范围的交集。 2. **使用前提条件**:基于引用[^2],强调容器必须有序、顺序一致,目标容器需要预先分配空间。 3. **函数原型**:参考引用[^3]和[^5],给出标准原型。 4. **使用方法步骤**:逐步说明如何调用函数。 5. **代码示例**:提供一个简单的C++代码示例,展示set_intersection的实际应用。 6. **原理简述**:简要解释它是如何工作的(例如,基于双指针遍历)。 7. **注意事项**:再次强调关键点,如内存分配、顺序要求等。 8. **生成相关问题**:在最后添加相关问题列表。 使用中文回答: - 整个回答用中文书写。 数学表达式: - 交集的概念可以用$A \cap B$表示。 - 如果在解释原理时有公式,使用$...$或$$...$$。 引用添加: - 当提到特定点如条件要求时,引用[^2]。 - 当给出函数原型时,引用[^3]或[^5]。 - 自然添加,如“容器必须有序且顺序一致[^2]。” 生成相关问题: - 在回答末尾,添加“§§相关问题§§”部分,列出相关问题,如其他集合算法、优化方法等。 完整回答大纲: 1. **引言**:解释set_intersection的作用。 2. **前提条件**:说明要求。 3. **函数原型**:给出原型。 4. **示例代码**:完整代码块。 5. **解释**:代码的含义和输出。 6. **原理**:简述算法。 7. **注意事项**:提醒常见错误。 8. **相关问题**:生成相关问题。 确保真实可靠:基于标准C++ STL知识,引用提供了可靠依据。 </think> ### C++ `set_intersection` 使用方法及示例 `set_intersection` 是 C++ 标准模板库(STL)中的一种集合算法,用于计算两个有序范围的交集(intersection)。交集表示属于两个集合的公共元素组成的集合,数学上表示为 $A \cap B$。该函数基于双指针遍历算法高效实现,时间复杂度为 $O(n + m)$(n 和 m 分别为两个容器的大小)。下面我将逐步解释其使用方法、提供完整示例,并说明关键原理。 #### 1. **功能与前提条件** - **功能**:`set_intersection` 计算两个有序范围的交集,并将结果存储到目标容器中。 - **前提条件**: - 两个输入容器必须有序(升序或降序),且顺序必须一致(例如,都升序)[^2]。 - 目标容器需预先分配足够内存。交集元素个数至多为两容器大小的较小值,因此需调用 `resize(min(src1.size(), src2.size()))` 提前开辟空间[^2]。 - 函数不自动检查容器是否有序,若输入无序,程序可能运行时崩溃。 - 需包含头文件:`#include <algorithm>` [^2]。 #### 2. **函数原型** 标准原型如下(基于 C++11 及以上): ```cpp template <class InputIt1, class InputIt2, class OutputIt> OutputIt set_intersection(InputIt1 first1, InputIt1 last1, InputIt2 first2, InputIt2 last2, OutputIt d_first); ``` - **参数**: - `first1, last1`:第一个有序范围的起始和结束迭代器(例如,容器 `v1` 的 `begin()` 和 `end()`)。 - `first2, last2`:第二个有序范围的起始和结束迭代器(例如,容器 `v2` 的 `begin()` 和 `end()`)。 - `d_first`:目标容器的起始迭代器(结果将从此位置写入)。 - **返回值**:指向目标容器中交集元素末尾的下一个位置的迭代器(用于后续调整大小)[^3][^5]。 对于 C++17,还有并行版本,但基本用法相同[^4]。 #### 3. **使用步骤** 1. **准备输入容器**:确保两个输入容器有序(如使用 `sort` 排序)。 2. **分配目标容器内存**:调用 `resize(min(src1.size(), src2.size()))` 避免溢出。 3. **调用函数**:传入源容器的迭代器和目标容器的起始迭代器。 4. **调整目标容器大小**:使用返回值截断多余空间。 5. **验证结果**:遍历目标容器输出交集。 #### 4. **完整代码示例** 以下示例展示如何计算两个向量的交集: ```cpp #include <iostream> #include <vector> #include <algorithm> // 包含 set_intersection 头文件 int main() { // 定义并排序两个输入向量(必须有序) std::vector<int> v1 = {1, 3, 5, 7, 9}; std::vector<int> v2 = {3, 5, 7, 8, 10}; std::sort(v1.begin(), v1.end()); // 确保升序 std::sort(v2.begin(), v2.end()); // 确保升序 // 准备目标容器,预先分配内存 std::vector<int> dest; dest.resize(std::min(v1.size(), v2.size())); // 分配最小空间,避免崩溃 // 调用 set_intersection 计算交集 auto it = std::set_intersection( v1.begin(), v1.end(), v2.begin(), v2.end(), dest.begin() ); // 调整目标容器大小,移除多余元素 dest.resize(it - dest.begin()); // 输出交集结果 std::cout << "交集元素:"; for (int num : dest) { std::cout << num << " "; } std::cout << std::endl; // 输出:交集元素:3 5 7 return 0; } ``` - **输出**:`交集元素:3 5 7` - **解释**: - 输入向量 `v1 = {1, 3, 5, 7, 9}` 和 `v2 = {3, 5, 7, 8, 10}` 的交集是 `{3, 5, 7}`。 - 目标容器 `dest` 必须预先 `resize`,否则可能崩溃[^2]。 - 遍历时使用调整大小后的 `dest`,避免多余填充值(如未初始化元素)[^2]。 #### 5. **算法原理简述** `set_intersection` 基于双指针算法: - **原理**:同时遍历两个有序范围: 1. 比较当前元素:若 `*it1 == *it2`,则将元素复制到目标容器,并移动两个迭代器。 2. 若 `*it1 < *it2`,则仅移动第一个范围的迭代器。 3. 若 `*it1 > *it2`,则仅移动第二个范围的迭代器。 - 算法持续直到任一范围结束,时间复杂度为 $O(\max(n, m))$[^5]。 - **数学基础**:交集定义为 $A \cap B = \{ x \mid x \in A \text{ and } x \in B \}$,函数高效实现了这一集合操作。 #### 6. **注意事项** - **顺序要求**:输入容器必须有序且排序方向一致(例如,都升序),否则结果未定义或崩溃[^2]。 - **内存管理**:忽略 `resize` 可能导致运行时错误;目标容器类型应与输入兼容(如整数或自定义可比较对象)。 - **性能**:在有序数据上高效,但不适合无序容器(应先排序)。 - **适用场景**:常用于数据分析、数据库查询优化(如查找公共记录)或集合运算库[^1][^5]。 通过以上步骤,您可以安全使用 `set_intersection` 处理有序数据。实践中,结合 `set_union` 和 `set_difference` 可覆盖更多集合操作需求[^1][^5]。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值