并查集(模版题HDOJ1232 畅通工程)(HDOJ1198 Farm Irrigation)

本文详细介绍了并查集这一高效的数据结构,包括其概念、数据结构定义、基本操作(查询与合并)及优化方法,并提供了具体的代码实现案例。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

概念:个人理解为一种用来表示结点连通关系的树状结构,简单地用数组进行不同集合元素的合并(Union)和查询(Find)操作。


数据结构:father[i],若为正,则表示i结点所在集合的代表元(根结点)序号,若为负,则表示以i为代表元的集合所包含的元素个数。


操作:

1.查询(Find):判断两个结点是否在同一集合中。递归或非递归地找出i和j所在集合的代表元,相同即在同一集合。

2.合并(Union):合并两个不相交集合。找出i,j所在集合的代表元ii,jj,使father[ii]=jj。


优化:

当一个集合的树形结构形成链状的时候,每次寻找根结点都会耗费比较多的时间。于是通过递归地压缩路径使得集合中每个非根结点的father[i]都直接指向根结点。另外,在Union时可以同过比较元素个数,使较少元素的集合合并到较多元素的集合中去。


具体代码通过模版题HDOJ1232 畅通工程(http://acm.hdu.edu.cn/showproblem.php?pid=1232)贴出来。


代码如下:

#include<cstdio>
#include<iostream>
#include<cstring>
int father[10000];
int Find(int x)
{
    while(father[x]>0) father[x]=Find(father[x]);//递归地压缩路径
    return father[x];
}
void Union(int a,int b)
{
    int fa,fb;
    fa=Find(a);
    fb=Find(b);
    if(fa==fb) {}
    else if(father[fa]<=father[fb])//小集合并入大集合
    {
        father[fa]+=father[fb];
        father[fb]=fa;
    }
    else
    {
        father[fb]+=father[fa];
        father[fa]=fb;
    }
    return;
}
int main()
{
    int n,m,a,b,i,ans;
    while(scanf("%d",&n)&&n)
    {
        memset(father,-1,sizeof(father));
        scanf("%d",&m);
        while(m--)
        {
            scanf("%d%d",&a,&b);
            Union(a,b);
        }
        for(i=1,ans=0;i<=n;i++)
            if(father[i]<0) ans++;
        printf("%d\n",ans-1);
    }
    return 0;
}

另外再推荐一道比较唬人的题:

HDOJ1198 Farm Irrigation(http://acm.hdu.edu.cn/showproblem.php?pid=1198)

也贴上代码(略凶残):

#include<cstdio>
#include<cstring>
using namespace std;
int father[10010];
char s[101][101];
int Find(int x)
{
    while(father[x]>0) x=father[x];
    return x;
}
void Union(int x,int y)
{
    int fx=Find(x);
    int fy=Find(y);
    if(fx!=fy) father[fx]=fy;
    return;
}
int main()
{
    int m,n,i,j,ans,k;
    while(1)
    {
        scanf("%d%d",&m,&n);
        if(m==-1&&n==-1) break;
        memset(father,-1,sizeof(father));
        for(i=1,k=0; i<=m; i++)
        {
            getchar();
            for(j=1; j<=n; j++)
            {
                k++;
                scanf("%c",&s[i][j]);
                if(i>1&&(s[i][j]=='A'||s[i][j]=='B'||s[i][j]=='E'||s[i][j]=='G'||s[i][j]=='H'||s[i][j]=='J'||s[i][j]=='K')&&(s[i-1][j]=='C'||s[i-1][j]=='D'||s[i-1][j]=='E'||s[i-1][j]=='H'||s[i-1][j]=='I'||s[i-1][j]=='J'||s[i-1][j]=='K'))
                    Union(k,k-n);
                if(j>1&&(s[i][j]=='A'||s[i][j]=='C'||s[i][j]=='F'||s[i][j]=='G'||s[i][j]=='H'||s[i][j]=='I'||s[i][j]=='K')&&(s[i][j-1]=='B'||s[i][j-1]=='D'||s[i][j-1]=='F'||s[i][j-1]=='G'||s[i][j-1]=='I'||s[i][j-1]=='J'||s[i][j-1]=='K'))
                    Union(k,k-1);
            }
        }
        for(i=1,ans=0;i<=n*m;i++) if(father[i]<0) ans++;
        printf("%d\n",ans);
    }
    return 0;
}


资源下载链接为: https://pan.quark.cn/s/140386800631 通用大模型文本分类实践的基本原理是,借助大模型自身较强的理解和推理能力,在使用时需在prompt中明确分类任务目标,并详细解释每个类目概念,尤其要突出类目间的差别。 结合in-context learning思想,有效的prompt应包含分类任务介绍及细节、类目概念解释、每个类目对应的例子和待分类文本。但实际应用中,类目和样本较多易导致prompt过长,影响大模型推理效果,因此可先通过向量检索缩小范围,再由大模型做最终决策。 具体方案为:离线时提前配置好每个类目的概念及对应样本;在线时先对给定query进行向量召回,再将召回结果交给大模型决策。 该方法不更新任何模型参数,直接使用开源模型参数。其架构参考GPT-RE并结合相关实践改写,加入上下文学习以提高准确度,还使用BGE作为向量模型,K-BERT提取文本关键词,拼接召回的相似例子作为上下文输入大模型。 代码实现上,大模型用Qwen2-7B-Instruct,Embedding采用bge-base-zh-v1.5,向量库选择milvus。分类主函数的作用是在向量库中召回相似案例,拼接prompt后输入大模型。 结果方面,使用ICL时accuracy达0.94,比bert文本分类的0.98低0.04,错误类别6个,处理时添加“家居”类别,影响不大;不使用ICL时accuracy为0.88,错误58项,可能与未修改prompt有关。 优点是无需训练即可有较好结果,例子优质、类目界限清晰时效果更佳,适合围绕通用大模型api打造工具;缺点是上限不高,仅针对一个分类任务部署大模型不划算,推理速度慢,icl的token使用多,用收费api会有额外开销。 后续可优化的点是利用key-bert提取的关键词,因为核心词语有时比语意更重要。 参考资料包括
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值