题目大意
给出字符串s,多组询问子串中本质不同子串个数。
解题报告
典型的后缀树/后缀自动机模板题,然而都不会,所以直接用hash。
考虑枚举出一个子串出现在[L,R],那么如果没有重复,所有包含着这个子串[L,R]的区间答案+1,但是如果出现了重复,那么就需要-1。但之前处理的时候有些区间已经去过重了,不能误删,这里可以在之前处理的时候用hash存储每个相同长度的子串,然后如果找到重复的子串[L’,R’],那么防止重复,就在前面没有处理过的包含区间[L’,R]的区间就需要-1。然后就可以DP预处理一波, O(1) O ( 1 ) 输出答案。
示例代码
#include<cstdio>
#include<cstring>
using namespace std;
typedef unsigned long long LL;
const int bse=139,tt=10007;
int tst,n,q,f[2005][2005];
LL pw[2005],sum[2005];
char s[2005];
struct hashmp{
int tot,lnk[tt],nxt[2005],le[2005]; LL a[2005];
void _init(){
tot=0;
memset(lnk,0,sizeof(lnk));
}
int _add(LL x,int i){
int y=x%tt;
for (int j=lnk[y];j;j=nxt[j])
if (a[j]==x){
int tem=le[j];
le[j]=i;
return tem;
}
le[++tot]=i; a[tot]=x; nxt[tot]=lnk[y]; lnk[y]=tot;
return -1;
}
}h;
inline void readi(int &x){
x=0; char ch=getchar();
while ('0'>ch||ch>'9') ch=getchar();
while ('0'<=ch&&ch<='9') {x=x*10+ch-'0'; ch=getchar();}
}
int main()
{
freopen("rein.in","r",stdin);
freopen("rein.out","w",stdout);
pw[0]=1; for (int i=1;i<=2e3;i++) pw[i]=pw[i-1]*bse;
readi(tst);
while (tst--){
scanf("%s",s+1); n=strlen(s+1); sum[0]=0;
for (int i=1;i<=n;i++) sum[i]=sum[i-1]*bse+s[i];
memset(f,0,sizeof(f));
for (int L=1;L<=n;L++){
h._init();
for (int i=1;i<=n-L+1;i++){
int le=h._add(sum[i+L-1]-sum[i-1]*pw[L],i);
f[i][i+L-1]++; if (le!=-1) f[le][i+L-1]--;
}
}
for (int i=n;i;i--)
for (int j=i;j<=n;j++)
f[i][j]+=f[i+1][j]+f[i][j-1]-f[i+1][j-1];
readi(q);
for (int x,y;q;q--){
readi(x); readi(y);
printf("%d\n",f[x][y]);
}
}
return 0;
}