题目链接:http://acm.hdu.edu.cn/showproblem.php?pid=2896
思路:
该题是在已知的字符串段落(网站)中查找是否含有所提供的字符串(病毒),并将其记录输出,应该采用AC自动机来解答。
注:
1.题目中的字符是除去回车的ASCII码可见字符(95个),我最开始定义的是以全部的ASCII码的个数(128)为基准的,然后显示超出内存限制。
2.题目中病毒序号的输出是从小到大的,输出的时候要记得排序。
#include<cstdio>
#include<cstring>
#include<queue>
using namespace std;
const int maxn=100,maxnn=100000+10;
char str[maxnn];
int ans[1005][5];//二维数组用来记录带有病毒的网站以及病毒序号
struct node{
int count;
struct node *next[maxn];//!ASCII码可见字符一共有95个
struct node *fail;
void init()
{
for(int i=0;i<maxn;i++)
next[i]=NULL;
count=0;
fail=NULL;
}
}*root;
//构建TRIE
void insert(int num)
{
node *p=root;
int len=strlen(str);
for(int i=0;i<len;i++)
{
int pos=str[i]-31;
if(p->next[pos]==NULL)
{
p->next[pos]=new node;
p->next[pos]->init();
p=p->next[pos];
}
else
p=p->next[pos];
}
p->count=num;//病毒的序号
}
//构建失败指针
void getfail()
{
node *p=root,*son,*temp;
queue<struct node *>que;
que.push(root);
p=root;
while(!que.empty())
{
temp=que.front();
que.pop();
for(int i=0;i<maxn;i++)
{
son=temp->next[i];
if(son!=NULL)
{
if(temp==root)
son->fail=root;
else
{
p=temp->fail;
while(p)//找是否有一样的字母
{
if(p->next[i])
{
son->fail=p->next[i];
break;
}
p=p->fail;
}
if(!p)
son->fail=root;
}
que.push(son);
}
}
}
}
void query(int num)
{
int nn=0;
int falg[100010];//标记当前网站找过的病毒
memset(falg,0,sizeof(falg));
int len=strlen(str);
node *p=root,*temp;
for(int i=0;i<len;i++)
{
int pos=str[i]-31;
while(!p->next[pos]&&p!=root)
p=p->fail;
p=p->next[pos];
if(!p)
p=root;
temp=p;
while(temp!=root)
{
if(temp->count>=1&&!falg[temp->count])
{
ans[num][nn++]=temp->count;
falg[temp->count]=1;//找过赋值为1
}
temp=temp->fail;
}
}
}
int main()
{
int n,m;
while(scanf("%d",&n)!=EOF)
{
getchar();//读取换行
root=new node;
root->init();
root->fail=NULL;
for(int i=1;i<=n;i++)
{
gets(str);
insert(i);
}
getfail();
scanf("%d",&m);
getchar();
memset(ans,0,sizeof(ans));
for(int i=1;i<=m;i++)
{
gets(str);
query(i);
}
int total=0;//记病毒个数
//输出!!!要从小到大输出
for(int i=1;i<=m;i++)
{
if(ans[i][0]>=1)
{
total++;
printf("web %d:",i);
int a[1005];
memset(a,0,sizeof(a));
for(int j=0;ans[i][j]>=1;j++)
{
a[ans[i][j]]=1;
}
for(int k=0;k<1005;k++)
{
if(a[k])
printf(" %d",k);
}
printf("\n");
}
}
printf("total: %d\n",total);
}
return 0;
}