[ZJOI2013]丽洁体

探讨了一种基于网络流行语的仿写句子算法挑战,旨在通过去除最少单词将不规范的句子转化为特定格式,考验算法的识别与匹配能力。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

题目描述

平时的练习和考试中,我们经常会碰上这样的题:命题人给出一个例句,要我们类比着写句子。这种往往被称为仿写的题,不单单出现在小学生的考试中,也有时会出现在中考中。许多同学都喜欢做这种题,因为较其它题显得有趣。仿写的句子往往具有“A__B__C”的形式,其中A,B,C是给定的由一个或多个单词组成的短句,空的部分需要学生填写。当然,考试的时候空在那里也是可以的。例如,“其实天不暗阴云终要散,其实 ,其实 ,其实路不远一切会如愿,艰难困苦的日子里我为你祈祷,请你保重每一天”。再比如,“见了大海的汹涌,没见过大山的巍峨,真是遗憾;见了大山的巍峨,没见过 ,还是遗憾。出发吧,永远出发。 ,人有不老的心情。”

由于现在是网络时代,我们不再只能仿写命题人命的题,我们可以仿写网上各种句子和段落。2011年3月26日,某人在博客上发布了的消息就惹来了很多人的仿写。

很难过吧。。。考得完爆了。。。

。。。。。。其实也没什么可以说的。。。都是蒟蒻的借口罢了。。。

。。。自己果然还只是半吊子水平呢。。。。

。。。祝大家都能进省队。。。其实只要不要有遗憾就好了呢。。。

虽然我很遗憾或许不能走下去了。。。。。

886

在网络上广泛流传的仿写,因为在某些地方有独到之处,大都被命名为“某某体”。打开人人,刷新微博,你也能发现这样和那样的体,比如,对不起体,**说明他爱你体等等。金先生注意到了这一现象,他敏锐地认为这是一个很有价值的研究课题,于是就其展开研究,打算发一篇paper。由于在网上发消息,人们有了更大的灵活度,人们有时因为表达的需要,还往原本固定的A, B, C中添加一些修饰的词语。这就给辨别一个句子或段落是否是另一个句子或段落的仿写增加了困难。

金先生现在研究一种形如“A*B*C”的体作品,其中A, B, C分别是某个由若干单词组成的短句,*代表0个或多个单词。他在网上找了大量的体作品,不过很多体作品不太合乎原作者的格式,也就是相当于在正规的体作品中插入了0个或多个单词。

由于数据量太大,金先生无法一个一个看过去,于是想请你帮忙,去掉尽量少的单词,使它成为指定的体。

输入输出格式

输入格式:

包含4行。

第一行是某个也许不规范的体作品T,

接下来三行分别代表A, B, C。

输出格式:

仅一行,包含一个数,即最少的去除单词数。

输入输出样例

输入样例#1: 复制
xiang yao yi zhi ai zhe mou wu de hua yi yao guai zhi si lai shuo tai chang le xiang yao shi xian yi qie meng xiang de hua yi ren lei zhi sheng lai shuo tai duan le
yao
tai chang le yao
tai duan le
输出样例#1: 复制
2

说明

【样例说明】

在上述样例中,不规范的体作品为:“想要一直爱着某物的话,以妖怪之死来说太长了;想要实现一切梦想的话,以人类之生来说太短了”。

规范的体形如:“要*太长了要*太短了”。

修改后的规范的体为:“要一直爱着某物的话,以妖怪之死来说太长了;要实现一切梦想的话,以人类之生来说太短了”。

【数据规模与约定】

对于20%的数据,1≤|T|, |A|, |B|, |C|≤10。 对于40%的数据,1≤|T|, |A|, |B|, |C|≤100。 对于70%的数据,1≤|T|, |A|, |B|, |C|≤1000。 对于100%的数据,1≤|T|, |A|, |B|, |C|≤50000;所有单词长度不超过5,出现次数不超过500;数据保证答案总存在。

先处理出A和C的,从前往后或从后往前扫一下

然后对于B

我们设f[i]表示B串中第i位匹配在T串中最晚在第几位

g[i]表示最小代价

根据贪心,i要与i-1位尽可能接近

 1 #include<iostream>
 2 #include<cstdio>
 3 #include<cstring>
 4 #include<algorithm>
 5 #include<cmath>
 6 #include<vector>
 7 using namespace std;
 8 char s[250010];
 9 int T[250010],a[250010],b[250010],c[250010],sum,ans;
10 int f[250010],g[250010];
11 vector<int>Q[15000001];
12 void init(int *p)
13 {int i,j,x;
14   char ch=getchar();
15   int len=0;
16   while (ch!='\n')
17     {
18       s[++len]=ch;
19       ch=getchar();
20     }
21   for (i=1;i<=len;i=j+1)
22     {
23       j=i;x=0;
24       while (j<=len&&s[j]>='a'&&s[j]<='z') x=x*27+s[j]-'a'+1,j++;
25       p[++p[0]]=x;
26     }
27 }
28 int main()
29 {int i,j;
30   init(T);init(a);init(b);init(c);
31   int l=1,r=T[0];
32   int x=1;
33   while (x<=a[0])
34     {
35       while (l<=T[0]&&a[x]!=T[l]) l++,sum++;
36       x++;l++;
37     }
38   x=c[0];
39   while (x>=1)
40     {
41       while (r>=1&&c[x]!=T[r]) r--,sum++;
42       x--;r--;
43     }
44   for (i=1;i<=b[0];i++)
45     Q[b[i]].push_back(i);
46   memset(g,127/3,sizeof(g));
47   ans=g[0];
48   for (i=l;i<=r;i++)
49     {
50       for (j=Q[T[i]].size()-1;j>=0;j--)
51     {
52       int x=Q[T[i]][j];
53       if (x==1) f[x]=i,g[x]=0;
54       else if (f[x-1]) f[x]=i,g[x]=g[x-1]+i-f[x-1]-1;
55     }
56       ans=min(ans,g[b[0]]);
57     }
58   cout<<ans+sum;
59 }

 

转载于:https://www.cnblogs.com/Y-E-T-I/p/8503694.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值