UVA 12706 Zero-Knowledge Protocol 字符串处理?思维?

本文介绍了一种用于寻找序列s中长度为m的子序列p的所有排列组合首次出现位置的算法,并通过计数这些位置的平方和来评估匹配度。算法采用滑动窗口的方式进行高效搜索,详细解释了其工作原理及实现细节。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

题意:给你一个长度为n的序列s,再给你一个长度为m的序列p,满足m<n,若,s[i.....i+m-1]=p,则我们称p为s的子序列且i为p出现的位置,现在,要求我们对p中的元素进行任意排列组合称为newp,并在s中找到newp第一次出现的位置i,计算所有位置的平方和。


题解:首先,由于对p任意排列组合,并在s中找到它,那么,我们可以不用去管p具体是怎么排列组合的,只需要知道p中的元素及其个数就行了,用map[si]记录s[i]所对应的元素出现的次数,则当统计完后,map的size就是p中不同元素的个数。这样我们对s从左往右扫描从头开始扫描。


定义这个扫描框的长度为m,其右端点为头,左端点为尾,同时定义一个cnt,记录p中与s在扫描框内不同元素的个数。

先大题说下流程。

那么当我们扫描的时候。

每一次右移头先扫描一个数St,则若map[St]=1,那么cnt--,若map[St]==0,则cnt++。

然后map[st]--。

接下来判断尾是否扫描了一个数(因为是从下标0开始扫描的,所以在前m个数中只有头没有尾)

若有尾扫描了一个数Sw,即从扫描框中拿出去一个数Sw,那么若map[Sw]==-1,cnt--,若map[Sw]==0,cnt++.接着map[Sw]++.

在每一步的最后,若cnt==0,则说明,在扫描框中的串与s中的一段匹配,则记录下这个串的位置。

下面说明。

对于一个p中的每个元素pi,map[pi]记录了它在p中出现的次数,那么对于一个空的长度为m的扫描框,我们只需要再向其中加入map[pi]个pi(i=1~map.size())元素,就可使扫描框内的元素构成p的一种排列组合。

那么cnt初始化为map.size就意味着我们还要cnt种不同的元素才有可能凑成p的一种排列。

那么对于每一次扫描,头加进来一个数st,就意味着需要的st元素少了一个(这就是为什么每次头判定的最后需要map[st]--),若此时其map值为一,那么说明这个st就是我们需要的最后一个st,即我们需要的不同元素少了一个,即cnt--。

而对于尾也是一样,具体看程序就明白了。

那么若加进来的元素st不是p中的元素怎么办呢。对于不是p中的元素,map的初始值为0,而由上面流程,map为0是,cnt++,即,扫描框中的不同元素多了一个,若之前扫描框为空,则此时cnt=m+1,意味着多了一个不需要的元素。而进行头判定后,map--变为-1,当下一次尾读到该元素的时候,相应的map为-1时,cnt--,意味着把这个不需要的元素去掉,而这个元素在扫描框内时,cnt是多了一的,无法变成0,所以,不会出现误判。

由上述流程我们知道,一个p中元素sp的map值一直在-1到k(k为sp在p中出现的次数)内变化,而一个非p中元素的map值非-1即0,所以它只会影响cnt的上限,而不会影响cnt的下限。


哎。蒟蒻就是蒟蒻,连话都讲不明白,小伙伴们还是看代码吧。


代码:

#include<bits/stdc++.h>
#define MEM(a,x) memset(a,x,sizeof(a));
#define MEMINF(a) memset(a,0x3f,sizeof(a));
using namespace std;
typedef long long LL;
const int MAXN=50000;
const int INF=0x3f3f3f3f;
const int MOD=1000000007;
int s[MAXN],p;
int main() {
  int Test;
  int n,m;
  int cnt;
  LL ans;
  cin>>Test;
  for (int cas=1; cas<=Test; ++cas) {
    ans=0;
    map<int,int>mp;
    cin>>n>>m;
    for (int i=0; i<n; ++i) scanf("%d",&s[i]);
    for (int i=0; i<m; ++i) scanf("%d",&p),mp[p]++;
    cnt=(int)mp.size();
    for (int i=0; i<n; ++i) {
      if (mp[s[i]]==1) cnt--;
      else if (mp[s[i]]==0) cnt++;
      mp[s[i]]--;
      if (i-m>=0) {
        if (mp[s[i-m]]==0) cnt++;
        else if (mp[s[i-m]]==-1) cnt--;
        mp[s[i-m]]++;
      }
      if (cnt==0) {
        LL pos=i-m+2;
        ans+=pos*pos;
      }
    }
    cout<<ans<<endl;
  }
}

    

   




资源下载链接为: https://pan.quark.cn/s/140386800631 通用大模型文本分类实践的基本原理是,借助大模型自身较强的理解和推理能力,在使用时需在prompt中明确分类任务目标,并详细解释每个类目概念,尤其要突出类目间的差别。 结合in-context learning思想,有效的prompt应包含分类任务介绍及细节、类目概念解释、每个类目对应的例子和待分类文本。但实际应用中,类目和样本较多易导致prompt过长,影响大模型推理效果,因此可先通过向量检索缩小范围,再由大模型做最终决策。 具体方案为:离线时提前配置好每个类目的概念及对应样本;在线时先对给定query进行向量召回,再将召回结果交给大模型决策。 该方法不更新任何模型参数,直接使用开源模型参数。其架构参考GPT-RE并结合相关实践改写,加入上下文学习以提高准确度,还使用BGE作为向量模型,K-BERT提取文本关键词,拼接召回的相似例子作为上下文输入大模型。 代码实现上,大模型用Qwen2-7B-Instruct,Embedding采用bge-base-zh-v1.5,向量库选择milvus。分类主函数的作用是在向量库中召回相似案例,拼接prompt后输入大模型。 结果方面,使用ICL时accuracy达0.94,比bert文本分类的0.98低0.04,错误类别6个,处理时添加“家居”类别,影响不大;不使用ICL时accuracy为0.88,错误58项,可能与未修改prompt有关。 优点是无需训练即可有较好结果,例子优质、类目界限清晰时效果更佳,适合围绕通用大模型api打造工具;缺点是上限不高,仅针对一个分类任务部署大模型不划算,推理速度慢,icl的token使用多,用收费api会有额外开销。 后续可优化的点是利用key-bert提取的关键词,因为核心词语有时比语意更重要。 参考资料包括
内容概要:本文详细介绍了哈希表及其相关概念和技术细节,包括哈希表的引入、哈希函数的设计、冲突处理机制、字符串哈希的基础、哈希错误率分析以及哈希的改进与应用。哈希表作为一种高效的数据结构,通过键值对存储数据,能够快速定位和检索。文中讨论了整数键值和字符串键值的哈希方法,特别是字符串哈希中的多项式哈希及其优化方法,如双哈希和子串哈希的快速计算。此外,还探讨了常见的冲突处理方法——拉链法和闭散列法,并提供了C++实现示例。最后,文章列举了哈希在字符串匹配、最长回文子串、最长公共子字符串等问题中的具体应用。 适合人群:计算机科学专业的学生、算法竞赛选手以及有一定编程基础并对数据结构和算法感兴趣的开发者。 使用场景及目标:①理解哈希表的工作原理及其在各种编程任务中的应用;②掌握哈希函数的设计原则,包括如何选择合适的模数和基数;③学会处理哈希冲突的方法,如拉链法和闭散列法;④了解并能运用字符串哈希解决实际问题,如字符串匹配、回文检测等。 阅读建议:由于哈希涉及较多数学知识和编程技巧,建议读者先熟悉基本的数据结构和算法理论,再结合代码实例进行深入理解。同时,在实践中不断尝试不同的哈希策略,对比性能差异,从而更好地掌握哈希技术。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值