[bzoj1212][字典树][dp]L语言

最新推荐文章于 2019-07-27 15:53:00 发布

原创最新推荐文章于 2019-07-27 15:53:00 发布 · 1k 阅读

1 ·

CC 4.0 BY-SA版权

bzoj 同时被 3 个专栏收录

482 篇文章

订阅专栏

123 篇文章

订阅专栏

OI路漫漫

108 篇文章

订阅专栏

本文介绍了一种用于处理无标点符号文本的算法。该算法通过构建Tire树来快速判断一段没有标点的文章是否能在给定字典下被理解，并找出最长可理解前缀的位置。适用于快速文本分析场景。

Description

标点符号的出现晚于文字的出现，所以以前的语言都是没有标点的。现在你要处理的就是一段没有标点的文章。一段文章T是由若干小写字母构成。一个单词W也是由若干小写字母构成。一个字典D是若干个单词的集合。我们称一段文章T在某个字典D下是可以被理解的，是指如果文章T可以被分成若干部分，且每一个部分都是字典D中的单词。例如字典D中包括单词{‘is’, ‘name’, ‘what’, ‘your’}，则文章‘whatisyourname’是在字典D下可以被理解的因为它可以分成4个单词：‘what’, ‘is’, ‘your’, ‘name’，且每个单词都属于字典D，而文章‘whatisyouname’ 在字典D下不能被理解，但可以在字典D’=D+{‘you’}下被理解。这段文章的一个前缀‘whatis’，也可以在字典D下被理解而且是在字典D下能够被理解的最长的前缀。给定一个字典D，你的程序需要判断若干段文章在字典D下是否能够被理解。并给出其在字典D下能够被理解的最长前缀的位置。

Input

输入文件第一行是两个正整数n和m，表示字典D中有n个单词，且有m段文章需要被处理。之后的n行每行描述一个单词，再之后的m行每行描述一段文章。其中1<=n, m<=20，每个单词长度不超过10，每段文章长度不超过1M。

Output

对于输入的每一段文章，你需要输出这段文章在字典D可以被理解的最长前缀的位置。

Sample Input

4 3
is
name
what
your
whatisyourname
whatisyouname
whaisyourname

Sample Output

14
6
0
整段文章’whatisyourname’都能被理解
前缀’whatis’能够被理解
没有任何前缀能够被理解

题解

发现一道水题~~怒刷5次RE~~
开始想着ac自动机，结果发现连自动机都不用建。一个Tire就够了。。
对单词建Tire，设f[i]表示文章中1~i这个串能否识别
那么，搜到每个位置，我们都暴力dp一遍
假设当前搜到的位置是单词了，设在串中匹配到了第k个地方
那么f[k]|=f[i]，i表示起始点
最后从后往前乱搞即可

#include<cstdio>
#include<cstring>
#include<cstdlib>
#include<algorithm>
#include<cmath>
#include<queue>
using namespace std;
struct Tire
{
    int c[28],s;
    Tire(){s=0;memset(c,-1,sizeof(c));}
}tr[3100];int tot,root;
char s[1110000];
void add(int root)
{
    int x=root,len=strlen(s+1);
    for(int i=1;i<=len;i++)
    {
        int y=s[i]-'a'+1;
        if(tr[x].c[y]==-1)tr[x].c[y]=++tot;
        x=tr[x].c[y];
    }
    tr[x].s++;
}
int f[1110000];//能否识别前i个字母的串 
int solve()
{
    memset(f,0,sizeof(f));
    f[0]=1;int len=strlen(s);
    for(int i=0;i<len;i++)
    {
        if(f[i]==0)continue;
        int x=root,k=i;
        while(tr[x].c[s[k]-'a'+1]!=-1)
        {
            x=tr[x].c[s[k]-'a'+1];
            k++;if(k>len)break;//由于没有判边界怒送RE
            if(tr[x].s>0)f[k]|=f[i];
        }
    }
    for(int i=len;i>=0;i--)if(f[i]==1)return i;
}
int n,m;
int main()
{
    scanf("%d%d",&n,&m);
    root=tot=0;
    for(int i=1;i<=n;i++)
    {
        scanf("%s",s+1);
        add(0);
    }
    while(m--)
    {
        scanf("%s",s);
        printf("%d\n",solve());
    }
    return 0;
}