![]() | ||||||||||
| ||||||||||
病毒侵袭Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 32768/32768 K (Java/Others)Total Submission(s): 11336 Accepted Submission(s): 2931
Problem Description
当太阳的光辉逐渐被月亮遮蔽,世界失去了光明,大地迎来最黑暗的时刻。。。。在这样的时刻,人们却异常兴奋——我们能在有生之年看到500年一遇的世界奇观,那是多么幸福的事儿啊~~
但网路上总有那么些网站,开始借着民众的好奇心,打着介绍日食的旗号,大肆传播病毒。小t不幸成为受害者之一。小t如此生气,他决定要把世界上所有带病毒的网站都找出来。当然,谁都知道这是不可能的。小t却执意要完成这不能的任务,他说:“子子孙孙无穷匮也!”(愚公后继有人了)。 万事开头难,小t收集了好多病毒的特征码,又收集了一批诡异网站的源码,他想知道这些网站中哪些是有病毒的,又是带了怎样的病毒呢?顺便还想知道他到底收集了多少带病毒的网站。这时候他却不知道何从下手了。所以想请大家帮帮忙。小t又是个急性子哦,所以解决问题越快越好哦~~
Input
第一行,一个整数N(1<=N<=500),表示病毒特征码的个数。
接下来N行,每行表示一个病毒特征码,特征码字符串长度在20—200之间。 每个病毒都有一个编号,依此为1—N。 不同编号的病毒特征码不会相同。 在这之后一行,有一个整数M(1<=M<=1000),表示网站数。 接下来M行,每行表示一个网站源码,源码字符串长度在7000—10000之间。 每个网站都有一个编号,依此为1—M。 以上字符串中字符都是ASCII码可见字符(不包括回车)。
Output
依次按如下格式输出按网站编号从小到大输出,带病毒的网站编号和包含病毒编号,每行一个含毒网站信息。
web 网站编号: 病毒编号 病毒编号 … 冒号后有一个空格,病毒编号按从小到大排列,两个病毒编号之间用一个空格隔开,如果一个网站包含病毒,病毒数不会超过3个。 最后一行输出统计信息,如下格式 total: 带病毒网站数 冒号后有一个空格。
Sample Input
Sample Output
|
这个题跟上一个题基本一样,只要保存一下病毒的编号就行了
#include<iostream>
#include<cstdio>
#include<string>
#include<cstring>
#include<vector>
#include<cmath>
#include<queue>
#include<stack>
#include<map>
#include<set>
#include<algorithm>
using namespace std;
const int maxn=550;
const int maxm=510*200;
const int SIGMA_SIZE=130;
int N,M;
vector<int> ans;
char s[10010];
struct AC
{
int ch[maxm][SIGMA_SIZE];
int fail[maxm],last[maxm];
int val[maxm];
int sz;
void clear(){memset(ch[0],0,sizeof(ch[0]));sz=1;}
int idx(char x){return int(x);}
void insert(char *s,int id)
{
int u=0,n=strlen(s);
for(int i=0;i<n;i++)
{
int c=idx(s[i]);
if(!ch[u][c])
{
memset(ch[sz],0,sizeof(ch[sz]));
val[sz]=0;
ch[u][c]=sz++;
}
u=ch[u][c];
}
val[u]=id;
}
void getfail()
{
queue<int> q;
int u=0;
fail[0]=0;
for(int i=0;i<SIGMA_SIZE;i++)
{
u=ch[0][i];
if(u){fail[u]=last[u]=0;q.push(u);}
}
while(!q.empty())
{
int r=q.front();q.pop();
for(int c=0;c<SIGMA_SIZE;c++)
{
u=ch[r][c];
if(!u){ch[r][c]=ch[fail[r]][c];continue;}
q.push(u);
int v=fail[r];
while(v&&!ch[v][c])v=fail[v];
fail[u]=ch[v][c];
last[u]=val[fail[u]]?fail[u]:last[fail[u]];
}
}
}
void find(char *s)
{
int n=strlen(s);
int u=0;
for(int i=0;i<n;i++)
{
int c=idx(s[i]);
u=ch[u][c];
int temp=0;
if(val[u])temp=u;
else if(last[u])temp=last[u];
while(temp)
{
ans.push_back(val[temp]);
temp=last[temp];
}
}
}
}tree;
int main()
{
while(scanf("%d",&N)!=EOF)
{
tree.clear();
for(int i=1;i<=N;i++)
{
scanf("%s",s);
tree.insert(s,i);
}
tree.getfail();
scanf("%d",&M);
int cnt=0;
for(int cas=1;cas<=M;cas++)
{
scanf("%s",s);
ans.clear();
tree.find(s);
sort(ans.begin(),ans.end());
int len=unique(ans.begin(),ans.end())-ans.begin();
if(len==0)continue;
cnt++;
printf("web %d:",cas);
for(int i=0;i<len;i++)printf(" %d",ans[i]);
printf("\n");
}
printf("total: %d\n",cnt);
}
return 0;
}
本文介绍了一个关于病毒特征码匹配的问题,通过构建AC自动机实现对多个病毒特征码的同时搜索。文章提供了完整的代码示例,展示了如何处理输入数据、构建自动机并进行高效匹配。

1628

被折叠的 条评论
为什么被折叠?



