Alice有n个字符串S1,S2...SnS_1,S_2...S_nS1,S2...Sn,Bob有一个字符串集合TTT,一开始集合是空的。
接下来会发生qqq个操作,操作有两种形式:
“1 P”,Bob往自己的集合里添加了一个字符串PPP。
“2 x”,Alice询问Bob,集合T中有多少个字符串包含串SxS_xSx。(我们称串AAA包含串BBB,当且仅当BBB是AAA的子串)
Bob遇到了困难,需要你的帮助。
【数据范围】
1<=n,q<=1000001 <= n,q <= 1000001<=n,q<=100000
Alice和Bob拥有的字符串长度之和各自都不会超过 200000020000002000000
字符串都由小写英文字母组成。
我们求一个串被多少个串包含,如果是求一个串在其他很多串中出现的次数,我们可以用广义后缀自动机。但是求被包含至少一次的母串数量实在是无能为力(或许是可做的?我无能为力)。
我们可以用AC自动机。
当匹配串匹配到某一个节点上时,其与其上面后缀连接的所有点代表的字符串都算出现了一次。
如果我们把SSS建成一颗AC自动机,那么一个匹配串会使其所有前缀所在节点上面的后缀树链的点都出现,询问一个SSS出现了几次相当于是求子树和,但是询问在几个匹配串中出现需要减去算重了的。
对于一个匹配串,对其所有前缀所在节点按dfs序排序,然后相邻的节点的LCA处-1,这样求子树和时每个匹配串只会被贡献最多1。
AC Code(475248kb。。。):
#include<bits/stdc++.h>
#define maxn 2000005
#define N 100005
#define lim 23
using namespace std;
int n;
char s[maxn];
struct node{
int ch[26],f;
}t[maxn];
int rt=0,tot=0,pos[N];
void insert(char *s,int id){
int u = rt;
for(int i=0,len=strlen(s);i<len;i++){
if(!t[u].ch[s[i]-'a']) t[u].ch[s[i]-'a'] = ++tot;
u = t[u].ch[s[i]-'a'];
}
pos[id] = u;
}
int f[lim][maxn],dep[maxn];
vector<int>G[maxn];
void Build(){
static queue<int>q;
t[0].f = -1;
for(int i=0;i<26;i++) if(t[0].ch[i]) q.push(t[0].ch[i]),t[t[0].ch[i]].f = 0;
for(int u;!q.empty();){
u = q.front() , q.pop();
dep[u] = dep[f[0][u] = t[u].f] + 1;
//printf("%d %d\n",u,f[0][u]);
G[t[u].f].push_back(u);
for(int i=0;i<26;i++)
if(t[u].ch[i]) t[t[u].ch[i]].f = t[t[u].f].ch[i] , q.push(t[u].ch[i]);
else t[u].ch[i] = t[t[u].f].ch[i];
}
}
int Lca(int u,int v){
//printf("%d %d\n",u,v);
if(dep[u] < dep[v]) swap(u,v);
for(int i=0;dep[u]!=dep[v];i++)
if((dep[u]-dep[v])>>i&1)
u=f[i][u];
//printf("%d %d\n",u,v);
if(u == v) return u;
for(int i=lim-1;i>=0;i--)
if(f[i][u]!=f[i][v])
u = f[i][u] , v = f[i][v];
return f[0][u];
}
int st[maxn],ed[maxn],dfn;
void dfs(int now){
st[now] = ++dfn;
for(int i=0,siz=G[now].size();i<siz;i++)
dfs(G[now][i]);
ed[now] = dfn;
}
int tr[maxn];
inline void upd(int now,int val){ for(;now<=dfn;now+=now&-now) tr[now]+=val; }
inline int qsum(int now,int ret=0){for(;now; now-=now&-now) ret+=tr[now];return ret; }
int seq[maxn];
inline bool cmp(const int &u,const int &v){ return st[u] < st[v]; }
int main(){
scanf("%d",&n);
for(int i=1;i<=n;i++){
scanf("%s",s);
insert(s,i);
}
Build();
dfs(0);
for(int j=1;j<lim;j++)
for(int i=1;i<=tot;i++)
f[j][i] = f[j-1][f[j-1][i]];
int q;
scanf("%d",&q);
for(int op,x;q--;){
scanf("%d",&op);
if(op == 1){
scanf("%s",s);seq[0] = 0;
for(int i=0,len=strlen(s),u=rt,pu=rt;i<len;i++){
u = t[u].ch[s[i]-'a'];
seq[++seq[0]] = u;
}
sort(seq+1,seq+1+seq[0],cmp);
for(int i=1;i<=seq[0];i++){
//printf("%d %d\n",seq[i],seq[i-1]);
upd(st[seq[i]],1);
if(i > 1)
{
//printf("%d\n",Lca(seq[i],seq[i-1]));
upd(st[Lca(seq[i],seq[i-1])],-1);}
}
}
else{
scanf("%d",&x);
printf("%d\n",qsum(ed[pos[x]])-qsum(st[pos[x]]-1));
}
}
}