L2-002 集合相似度(set)

本文解析了PATest CN平台上的一个题目,通过使用C++标准模板库(set)来实现两个集合的交集计算,并计算交集元素占总元素的比例。此题涉及输入多个整数并进行集合操作。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

题目:https://www.patest.cn/contests/gplt/L2-005

题意:Nc=2:  87,101   Nt=4 : 87,101,99,5

#include<bits/stdc++.h>
using namespace std;

set <int> s[55];
int a,b;
void fun(){
    int same=0;
    set<int >::iterator it;
    for(it=s[a].begin();it!=s[a].end();it++)
        if(s[b].find(*it)!=s[b].end()) same++;
    int nt=s[a].size()+s[b].size()-same;
    printf("%.2f%%\n",same*1.0/nt*100);
}

int main(){
    int n,m,k;
    cin>>n;
    for(int i=1;i<=n;i++){
        cin>>m;
        for(int j=0;j<m;j++){
            int tmp;
            cin>>tmp;
            s[i].insert(tmp);
        }
    }
    cin>>k;
    for(int i=0;i<k;i++){
        cin>>a>>b;
        fun();
    }
    return 0;
}

### 计算集合相似度的算法实现 #### 背景说明 为了计算两个集合之间的相似度,通常采用一种基于交集与并集的比例方法。具体而言,通过统计两集合中共有元素的数量 \( N_c \),以及两集合总的不同元素数量 \( N_t \),可以得出其相似度比例。 相似度公式如下: \[ \text{Similarity} = \frac{N_c}{N_t} \times 100\% \] 其中, - \( N_c \) 表示两集合共有不同整数的个数; - \( N_t \) 表示两集合一共含有的不同整数的个数。 此公式的理论基础已在站内引用中提及[^1]。 --- #### Python 实现代码 以下是使用 Python 编写的集合相似度计算函数: ```python def calculate_similarity(set_a, set_b): # 将输入列表转换为集合以去除重复项 unique_set_a = set(set_a) unique_set_b = set(set_b) # 计算交集和并集 intersection_count = len(unique_set_a.intersection(unique_set_b)) # 共同元素个数 Nc union_count = len(unique_set_a.union(unique_set_b)) # 总共不同元素个数 Nt # 如果并集为空,则返回 0%,防止除零错误 if union_count == 0: return 0.0 # 计算相似度百分比 similarity_percentage = (intersection_count / union_count) * 100 return round(similarity_percentage, 2) # 返回保留两位小数的结果 # 测试用例 set_a = [1, 2, 3, 4, 5] set_b = [3, 4, 5, 6, 7] similarity_result = calculate_similarity(set_a, set_b) print(f"The similarity between the two sets is {similarity_result}%.") ``` 上述代码实现了以下功能: 1. **去重处理**:将输入的列表转化为集合,自动移除重复元素。 2. **交集与并集运算**:利用 `set` 的内置方法 `.intersection()` 和 `.union()` 来分别获取共同元素和全部唯一元素。 3. **异常处理**:当两集合均为空时,避免因分母为零而导致程序崩溃。 4. **结果精度控制**:最终结果四舍五入至两位小数。 --- #### Java 实现代码 如果需要在 Java 中实现该逻辑,可参考以下代码片段: ```java import java.util.HashSet; import java.util.Set; public class SetSimilarity { public static double calculateSimilarity(int[] arrayA, int[] arrayB) { // 创建 HashSet 并填充数据 Set<Integer> setA = new HashSet<>(); for (int num : arrayA) { setA.add(num); } Set<Integer> setB = new HashSet<>(); for (int num : arrayB) { setB.add(num); } // 获取交集和并集 Set<Integer> intersection = new HashSet<>(setA); intersection.retainAll(setB); // 只保留两者都存在的元素 Set<Integer> union = new HashSet<>(setA); union.addAll(setB); // 合并两者的所有元素 // 防止除零错误 if (union.size() == 0) { return 0.0; } // 计算相似度 return ((double) intersection.size() / union.size()) * 100; } public static void main(String[] args) { int[] setA = {1, 2, 3, 4, 5}; int[] setB = {3, 4, 5, 6, 7}; double result = calculateSimilarity(setA, setB); System.out.printf("The similarity between the two sets is %.2f%%.\n", result); } } ``` Java 版本同样遵循了相同的逻辑框架,并提供了更详细的注释以便于理解。 --- #### 注意事项 1. 输入的数据应先经过预处理,确保不会包含非法字符或其他非数值类型的干扰因素。 2. 当集合完全一致时,\( N_c = N_t \),此时相似度为 100%;而当无任何公共元素时,相似度则降为 0%。 3. 对于大规模数据集,需考虑性能优化策略,例如减少不必要的内存占用或提高哈希表查找效率。 ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值