[HNOI2004]L语言
题目描述
标点符号的出现晚于文字的出现,所以以前的语言都是没有标点的。现在你要处理的就是一段没有标点的文章。
一段文章T是由若干小写字母构成。一个单词W也是由若干小写字母构成。一个字典D是若干个单词的集合。我们称一段文章T在某个字典D下是可以被理解的,是指如果文章T可以被分成若干部分,且每一个部分都是字典D中的单词。
例如字典D中包括单词{‘is’, ‘name’, ‘what’, ‘your’},则文章‘whatisyourname’是在字典D下可以被理解的,因为它可以分成4个单词:‘what’, ‘is’, ‘your’, ‘name’,且每个单词都属于字典D,而文章‘whatisyouname’在字典D下不能被理解,但可以在字典D’=D+{‘you’}下被理解。这段文章的一个前缀‘whatis’,也可以在字典D下被理解,而且是在字典D下能够被理解的最长的前缀。
给定一个字典D,你的程序需要判断若干段文章在字典D下是否能够被理解。并给出其在字典D下能够被理解的最长前缀的位置。
输入格式
输入文件第一行是两个正整数n和m,表示字典D中有n个单词,且有m段文章需要被处理。之后的n行每行描述一个单词,再之后的m行每行描述一段文章。
其中1<=n, m<=20,每个单词长度不超过10,每段文章长度不超过1M。
输出格式
对于输入的每一段文章,你需要输出这段文章在字典D可以被理解的最长前缀的位置。
字典树+各种思维算法;
这种题目已经知道算法是什么,但是跟裸题还是有很大区别;加了更多的思维在上面,可能这就是大佬跟蒟蒻的差距了;
刚开始的思路就是当查询到某个单词尾部时,又重新从头结点开始查询,直到全部查完;但是一直wa,看题解看到一组数据,当有单词what和whatis时,我们查询whatis,会当查到what直接又重头开始,所以一直wa;
要解决这个问题,题解给了一种很巧妙的方法;很难说清楚,看代码模拟一下就行;
代码:
#include<bits/stdc++.h>
#define LL long long
#define pa pair<int,int>
#define lson k<<1
#define rson k<<1|1
//ios::sync_with_stdio(false);
using namespace std;
const int N=1000100;
const int M=200100;
const LL mod=1e9+7;
int tr[N][30],val[N];
int rt;
int ans[N];
void add(string s){
int k=0;
for(int i=0;i<s.length();i++){
int d=s[i]-'a';
if(!tr[k][d]) tr[k][d]=++rt;
k=tr[k][d];
}
val[k]=1;//单词终止结点
}
void search(string s){
int k=0;
memset(ans,0,sizeof(ans));
for(int i=0;i<s.length();i++){
int d=s[i]-'a';
if(!tr[k][d]) break;
k=tr[k][d];
if(val[k]) ans[i]=1;//这个点是单词尾点
}
int bb=0;
for(int i=0;i<s.length();i++){
if(ans[i]) bb=i+1;
else continue;
int k=0;
for(int j=i+1;j<s.length();j++){
int d=s[j]-'a';
if(!tr[k][d]) break;
k=tr[k][d];
if(val[k]) ans[j]=1;
}
}
cout<<bb<<endl;
}
int main(){
ios::sync_with_stdio(false);
int n,m;
cin>>n>>m;
string s;
for(int i=1;i<=n;i++){
cin>>s;
add(s);
}
for(int i=1;i<=m;i++){
cin>>s;
search(s);
}
return 0;
}
本文探讨了使用字典树算法处理无标点符号的文章,旨在通过给定的字典判断文章是否可被理解,并找出最长可理解前缀。介绍了算法原理,包括如何构建字典树及搜索过程中的优化技巧。
1070

被折叠的 条评论
为什么被折叠?



