1.多模式串匹配
2 .在模式串she ,he,h 和文本串 shesheshe进行匹配 在两个匹配的模式串中找到的最长的后缀,因为在字典树中 eg:先匹配s 1.然后匹配了sh,在文本串中sh已经匹配过了,而sh在字典树中只会有一条路径,因为文本串中的sh已经匹配了,为了优化时间,我们可以找到sh的最长后缀模式串 h,
2.继续匹配she后,在文本串中she已经匹配过了,而she在字典树中只会有一条路径,因为文本串中的she已经匹配了,为了优化时间,我们可以找到she的最长后缀模式串 he,如果he 没有就去匹配模式串e
”比如说,在我举的例子中,当我们匹配到了she时,我们在树上走的路径也包含了he,he是she的一个后缀。我们在she上失配,至少说明我们已经匹配到了he,于是就可以跳到代表he的节点上继续匹配。
3 建立fail指针((根结点处在最高处)由低处指向高处)通过BFS 第二层结点的fail指针要做特殊处理
找到模式串在文本串出现的次数:
#include<bits/stdc++.h>
using namespace std;
const int maxn = 2e+6;
const int maxsize = 26;
int tree[maxn][maxsize];
int fail[maxn];
int num[maxn];
int pos=0;
int sum=0;
void insert(string str){
int length = str.size();
int root=0;
for(int i=0;i<length;i++){
int index = str[i]-'a';
if(!tree[root][index])
tree[root][index] = ++pos;
root=tree[root][index];
}
num[root]++;
}
void create_fail(){
int root=0;
queue<int> q;
for(int i=0;i<maxsize;i++){
if(tree[root][i]){
q.push(tree[root][i]);
fail[tree[root][i]]=0;
}
}
while(!q.empty()){
int now = q.front();
q.pop();
for(int i=0;i<maxsize;i++){
if(tree[now][i]){
fail[tree[now][i]]=tree[fail[tree[now][i]]][i];
q.push(tree[now][i]);
}else{
tree[now][i]=tree[fail[tree[now][i]]][i];
}
}
}
}
void select(string str){
int length = str.size();
for(int i=0;i<length;i++){
int index = str[i]-'a';
int now = tree[now][index];
for(int j=now;j;j=fail[j]){
sum+=num[now];
}
}
}
int main(){
int n;
string ss;
cin>>n;
for(int i=0;i<n;i++){
cin>>ss;
insert(ss);
}
create_fail();
cin>>ss;
select(ss);
cout<<sum<<endl;
return 0;
}