洛谷-2292 [HNOI2004]L语言

本文介绍了一种处理无标点符号文章的算法,通过字典树和动态规划方法,判断文章是否能被字典中的单词理解,并找到最长可理解前缀的位置。适用于文本处理和自然语言处理领域。

题目描述
标点符号的出现晚于文字的出现,所以以前的语言都是没有标点的。现在你要处理的就是一段没有标点的文章。
一段文章T是由若干小写字母构成。一个单词W也是由若干小写字母构成。一个字典D是若干个单词的集合。我们称一段文章T在某个字典D下是可以被理解的,是指如果文章T可以被分成若干部分,且每一个部分都是字典D中的单词。
例如字典D中包括单词{‘is’, ‘name’, ‘what’, ‘your’},则文章‘whatisyourname’是在字典D下可以被理解的,因为它可以分成4个单词:‘what’, ‘is’, ‘your’, ‘name’,且每个单词都属于字典D,而文章‘whatisyouname’在字典D下不能被理解,但可以在字典D’=D+{‘you’}下被理解。这段文章的一个前缀‘whatis’,也可以在字典D下被理解,而且是在字典D下能够被理解的最长的前缀。
给定一个字典D,你的程序需要判断若干段文章在字典D下是否能够被理解。并给出其在字典D下能够被理解的最长前缀的位置。
输入格式
输入文件第一行是两个正整数n和m,表示字典D中有n个单词,且有m段文章需要被处理。之后的n行每行描述一个单词,再之后的m行每行描述一段文章。
其中1<=n, m<=20,每个单词长度不超过10,每段文章长度不超过1M。
输出格式
对于输入的每一段文章,你需要输出这段文章在字典D可以被理解的最长前缀的位置。
输入输出样例

输入 #1
4 3
is
name
what
your
whatisyourname
whatisyouname
whaisyourname

输出 #1
14 (整段文章’whatisyourname’都能被理解)
6 (前缀’whatis’能够被理解)
0 (没有任何前缀能够被理解)

解释: d p [ i ] dp[i] dp[i]:从0~i是否可以被理解。则 d p [ i ] = I ( [ s t r i , s t r i − 1 . . , s t r j ] ∈ D )   a n d   d p [ j − 1 ] ) dp[i]=I([str_i,str_{i-1}..,str_{j}] \in D) \ and \ dp[j-1]) dp[i]=I([stri,stri1..,strj]D) and dp[j1])其中 D D D为字典集合,我们用字典树建立字典,然后 d p dp dp暴力匹配找最大就好了

#include<iostream>
#include<algorithm>
#include<cstring>
using namespace std;
int n=0,m=0;
struct node{
    node *tree[26];
    int v;
};
void free(node *rt){
    if(!rt) return;
    for(int i=0;i<26;i++) free(rt->tree[i]);
    delete rt;
}
void init(node *rt){
    for(int i=0;i<26;i++) rt->tree[i]=NULL;
    rt->v=0;
}
void insert(node *rt,char *str){
    node *temp=rt;
    for(int i=0;str[i];i++){
        int y=str[i]-'a';
        if(temp->tree[y]==NULL){
            temp->tree[y]=new node;
            init(temp->tree[y]);
        }
        temp=temp->tree[y];
    }
    temp->v=1;
}
node *root=new node;
bool dp[1000005]={0};
char str[1000005];
int main(){
    init(root);
    ios::sync_with_stdio(false);
    cin>>n>>m;
    for(int i=1;i<=n;i++){
        cin>>str;reverse(str,str+strlen(str));
        insert(root,str);
    }
    while(m--){
        int ret=0;
        cin>>str;
        for(int i=0;str[i];i++){
            dp[i]=0;
            node *temp=root;
            for(int j=i;j>=max(i-12,0);j--){
                int y=str[j]-'a';
                if(temp->tree[y]==NULL) break;
                temp=temp->tree[y];
                if(j<1||(temp->v&&dp[j-1])){
                    dp[i]=1;
                    break;
                }
            }
            if(dp[i]) ret=i+1;
        }
        cout<<ret<<endl;
    }
    free(root);
    return 0;
}

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值