广义后缀自动机,就是多主串后缀自动机,一般是先把多个串建出Trie,然后把Trie树建成SAM,这里的R集合定义为Trie上的节点。至于如何构建,与普通SAM差不多,只不过每次的last是Trie上的父亲在SAM中的节点即可。
但是你如果没建出Trie树,直接去构建SAM,有可能会有在Trie树上重复的节点,你需要把它判掉,否则在SAM上会存在重复的点,统计一些信息时就可能会出锅(对于此题而言,怎么建都不会出锅 囧)此处naive了,真正正确的广义SAM构建方法请见这一篇文章:portal
然后考虑对于此题,首先题目保证最多20个叶子,那么我们可以以每个叶子当根,得到20棵”Trie”,然后把他们合并成一棵大的Trie,我们就是求在这棵大Trie上有多少个本质不同的子串。
构建广义SAM即可,一个节点所代表的子串个数就是mx[x]-mn[x]+1,而mn[x]=mx[fa[x]]+1,因此答案就是
∑xmx[x]−mx[fa[x]]
∑
x
m
x
[
x
]
−
m
x
[
f
a
[
x
]
]
#include <cstdio>
#include <cstring>
#include <algorithm>
#include <queue>
using namespace std;
#define ll long long
#define inf 0x3f3f3f3f
#define N 100010
inline char gc(){
static char buf[1<<16],*S,*T;
if(S==T){T=(S=buf)+fread(buf,1,1<<16,stdin);if(T==S) return EOF;}
return *S++;
}
inline int read(){
int x=0,f=1;char ch=gc();
while(ch<'0'||ch>'9'){if(ch=='-')f=-1;ch=gc();}
while(ch>='0'&&ch<='9') x=x*10+ch-'0',ch=gc();
return x*f;
}
int n,C,h[N],num=0,du[N],col[N],rt,owo=0,par[N*40],son[N*40][10],mx[N*40];ll ans=0;
struct edge{
int to,next;
}data[N<<1];
inline int ins(int p,int ch){
if(son[p][ch]&&mx[son[p][ch]]==mx[p]+1) return son[p][ch];
int np=++owo;mx[np]=mx[p]+1;
for(;p&&!son[p][ch];p=par[p]) son[p][ch]=np;
if(!p){par[np]=rt;return np;}
int q=son[p][ch];
if(mx[q]==mx[p]+1){par[np]=q;return np;}
int nq=++owo;memcpy(son[nq],son[q],sizeof(son[q]));
mx[nq]=mx[p]+1;par[nq]=par[q];par[q]=par[np]=nq;
for(;p&&son[p][ch]==q;p=par[p]) son[p][ch]=nq;
return np;
}
inline void dfs(int x,int Fa,int p){
p=ins(p,col[x]);
for(int i=h[x];i;i=data[i].next){
int y=data[i].to;if(y==Fa) continue;dfs(y,x,p);
}
}
int main(){
// freopen("a.in","r",stdin);
n=read();C=read();rt=++owo;
for(int i=1;i<=n;++i) col[i]=read();
for(int i=1;i<n;++i){
int x=read(),y=read();du[x]++;du[y]++;
data[++num].to=y;data[num].next=h[x];h[x]=num;
data[++num].to=x;data[num].next=h[y];h[y]=num;
}for(int i=1;i<=n;++i) if(du[i]==1) dfs(i,0,rt);
for(int i=1;i<=owo;++i) ans+=mx[i]-mx[par[i]];
printf("%lld\n",ans);
return 0;
}