题意:告诉你一个字符串和k , 求这个字符串中有多少不同的子串恰好出现了k 次。
解题思路:先用后缀数组进行算出height,然后用ST表维护,然后用区间长为k进行查询,找出最小的height,目的是为了找出k都有的字符串长度,然后区间往左右分别扩展一个单位,目的是看看左右的重复情况,左右的最大值,代表超出K的范围。要注意K=1时是一种特殊情况,具体看代码理解,已经注释。
#include<cstdio>
#include<cstring>
#include<algorithm>
#include<cmath>
#include<iostream>
#define N 505000
using namespace std;
char s[N];
int sa[N],t1[N],t2[N],c[N],rnk[N],height[N],n,p[N][30];
void build_sa(int m)
{
int *x = t1, *y = t2;
for(int i=0; i<m; i++) c[i] = 0;
for(int i=0; i<n; i++) c[x[i] = s[i]]++;
for(int i=1;i<m;i++) c[i]+=c[i-1];//桶
for(int i=n-1;i>=0;i--) sa[--c[x[i]]]=i;
for(int k=1; k<=n; k = k<<1)
{
int p = 0;
//y是用来给第二关键字排序的
for(int i=n-k; i<n; i++) y[p++] = i; //后面几个第二关键字都没有,自然是最小的,排在前面
for(int i=0; i<n; i++) if(sa[i] >= k) y[p++] = sa[i]-k;//第二关键字的位置本来是sa[i],-k之后就变成它对应第一关键字的位置(直边所指)
for(int i=0; i<m; i++) c[i] = 0;//清空桶,要开始基数排序了
for(int i=0; i<n; i++) c[x[y[i]]]++;
for(int i=0; i<m; i++) c[i] += c[i-1];
for(int i=n-1; i>=0; i--) sa[--c[x[y[i]]]] = y[i];
swap(x,y);
p = 1; x[sa[0]] = 0;//从0开始赋值
for(int i=1; i<n; i++)//如果说第一关键字和第二关键字都和前面相同,那就给一个和前面一样的键值,否则就给一个新的更高的键值
x[sa[i]] = y[sa[i-1]] == y[sa[i]] && y[sa[i-1]+k] == y[sa[i]+k] ? p-1 : p++;
if(p >= n) break;//已经分出胜负了,各不相同
m = p;
}
}
void getheight()
{
int i,j,k = 0;
for(int i=0; i<n; i++) rnk[sa[i]] = i;
for(i = 0; i < n; i++)
{
if(k) k--;//h[i]>=h[i-1]-1
if(rnk[i] == 0)
{
height[rnk[i]] = 0;
continue;
}
j = sa[rnk[i]-1];
while(s[i+k] == s[j+k]) k++;
height[rnk[i]] = k;
}
}
void build_st()
{
for(int i=1;i<n;i++) p[i][0]=height[i];//必须从1开始,代表第一位
for(int j=1;j<=29;j++)
{
for(int i=1;i+(1<<j)-1<n;i++)
{
p[i][j]=min(p[i][j-1],p[i+(1<<(j-1))][j-1]);
}
}
}
int query(int l,int r)
{
if(l>r) return n-sa[r]-1;//真的算的时候,要把最后0给除掉,因为本来这个0就是多余添加的,不除外就是当这个0是一开始就在字符串中了
int k=log2(r-l+1);
//cout<<k<<" "<<l<<" "<<r<<"*"<<endl;
return min(p[l][k],p[r-(1<<k)+1][k]);
}
int main()
{
freopen("t.txt","r",stdin);
int T,k;
scanf("%d",&T);
while(T--)
{
scanf("%d",&k);
scanf("%s",s);
n=strlen(s);
s[n++]=0;
build_sa(128);
getheight();
for(int i=0;i<n;i++) printf("%d ",height[i]);
printf("\n");
build_st();
int ans=0;
k--;
for(int i=1;i<n-k+1;i++)
{
int l=i,r=i+k-1;
int len=query(l,r);
int more=max((l>1?query(l-1,r):0),(r<n-1?query(l,r+1):0));
ans+=max(0,(len-more));
}
printf("%d\n",ans);
}
return 0;
}