主题思想: 大部分说是AC自动机模板题,自动机我还不会,看别人说可以用tries做,这个我会,主要是刚开始没想好思路。
是利用关键字做tries 树, 我一开始还想着把文本构建tries呢。
主要用tries的Insert 和query 方法:
struct Node{
int val;
struct Node* next[R];
Node(){
val=-1;
memset(next,NULL,sizeof(next));
}
};
void Insert(Node* x,string s,int val){
int len=s.length();
int i=0;
int index;
while(i<len){
index=s[i]-'0';
if(x->next[index]==NULL){
x->next[index]=new Node();
}
x=x->next[index];
i++;
}
x->val=val;
}
void query(Node *x,char *s){
int i=0;
int len=strlen(s);
int index;
while(i<len){
index=s[i]-'0';
if(x->next[index]==NULL) return ;
x=x->next[index];
if(x->val!=-1&&!vis[x->val]){
ans.push_back(x->val);
vis[x->val]=true;
flag=true;
}
i++;
}
}
AC代码:
#include <iostream>
#include<cstdio>
#include<cstring>
#include<string>
#include<vector>
using namespace std;
const int maxn=10005;
const int R=10;
char txt[maxn*6];
string key[maxn];
bool vis[maxn];
bool flag=false;
vector<int> ans;
struct Node{
int val;
struct Node* next[R];
Node(){
val=-1;
memset(next,NULL,sizeof(next));
}
};
void Insert(Node* x,string s,int val){
int len=s.length();
int i=0;
int index;
while(i<len){
index=s[i]-'0';
if(x->next[index]==NULL){
x->next[index]=new Node();
}
x=x->next[index];
i++;
}
x->val=val;
}
void query(Node *x,char *s){
int i=0;
int len=strlen(s);
int index;
while(i<len){
index=s[i]-'0';
if(x->next[index]==NULL) return ;
x=x->next[index];
if(x->val!=-1&&!vis[x->val]){
ans.push_back(x->val);
vis[x->val]=true;
flag=true;
}
i++;
}
}
int main()
{
flag=false;
int m,n;
scanf("%d%d",&m,&n);
Node *root=new Node();
int line=0;
char ch;
int Index=0;
scanf("%c",&ch);
while(line<m){
scanf("%c",&ch);
if(ch=='\n'){
line++;
continue;
}
txt[Index++]=ch;
}
txt[Index]='\0';
string tmp;
for(int i=1;i<=n;i++){
for(int j=1;j<=3;j++){
cin>>tmp;
}
cin>>key[i];
Insert(root,key[i],i);
}
ans.clear();
for(int j=0;j<Index;j++){
query(root,txt+j);
}
if(flag){
printf("Found key:");
int len=ans.size();
for(int i=0;i<len;i++){
printf(" [Key No. %d]",ans[i]);
}
printf("\n");
}else{
printf("No key can be found !\n");
}
return 0;
}

这篇博客探讨了如何利用Trie树解决全文检索问题,重点在于Trie树的Insert和query操作。作者最初考虑将文本构建为Trie树,但最终实现了基于关键字的Trie树解决方案。
1734

被折叠的 条评论
为什么被折叠?



