标点符号的出现晚于文字的出现,所以以前的语言都是没有标点的。现在你要处理的就是一段没有标点的文章。一段文章T是由若干小写字母构成。一个单词W也是由若干小写字母构成。一个字典D是若干个单词的集合。我们称一段文章T在某个字典D下是可以被理解的,是指如果文章T可以被分成若干部分,且每一个部分都是字典D中的单词。例如字典D中包括单词{‘is’, ‘name’, ‘what’,‘your’},则文章‘whatisyourname’是在字典D下可以被理解的 因为它可以分成4个单词:‘what’, ‘is’,‘your’, ‘name’,且每个单词都属于字典D,而文章‘whatisyouname’在字典D下不能被理解,但可以在字典D’=D+{‘you’}下被理解。这段文章的一个前缀‘whatis’,也可以在字典D下被理解而且是在字典D下能够被理解的最长的前缀。 给定一个字典D,你的程序需要判断若干段文章在字典D下是否能够被理解。并给出其在字典D下能够被理解的最长前缀的位置。
这道题我们一开始可以先考虑一个朴素的dp,文章中f[i]来表示1~i是否可以被字典给理解,这个dp可以靠前面来更新,相信大家都应该会,但这样判断一段区间内是否可以被字典理解,暴力的话时间复杂度就太高了。我们就用一个trie来优化,那这样就可以快速判断,那这道题就解决了。
#include<cstdio>
#include<cstring>
#include<cstdlib>
#include<cmath>
#include<algorithm>
using namespace std;
struct tnode
{
int fail,s,c[27];
tnode()
{
fail=s=0;
memset(c,-1,sizeof(c));
}
}t[210];
int tot,mmax;
char s1[15],s2[1100000];
void bt(int root)
{
int x=root,len=strlen(s1+1);
mmax=max(mmax,len);
for(int i=1;i<=len;i++)
{
int y=s1[i]-'a';
if(t[x].c[y]==-1)t[x].c[y]=++tot;
x=t[x].c[y];
}
t[x].s=1;
}
int check(int st,int ed)
{
int x=0;
for(int i=st;i<=ed;i++)
{
int y=s2[i]-'a';
if(t[x].c[y]==-1)return 0;
x=t[x].c[y];
}
return t[x].s;
}
int f[1100000];
int main()
{
int n,m;
scanf("%d%d",&n,&m);
for(int i=1;i<=n;i++)scanf("%s",s1+1),bt(0);
for(int i=1;i<=m;i++)
{
memset(f,-1,sizeof(f));
scanf("%s",s2+1);
int len=strlen(s2+1),ans=0;
f[0]=0;
for(int j=0;j<len;j++)
{
for(int k=1;k<=min(mmax,len-j);k++)
{
if(f[j]!=-1 && check(j+1,j+k)!=0)f[j+k]=0,ans=max(ans,j+k);
}
}
printf("%d\n",ans);
}
return 0;
}