题意:给出一个字符串,找出某个子串第k次出现的位置
思路:后缀数组sa[i]数组表示排名第i的后缀第一次出现的下标,求第k次出现的下标只需要在某个区间中求sa数组中的第k大即可(主席树求第k大),确定区间时利用后缀数组中的lcp确定与子串具有相同前缀的后缀第一次出现位置和最后一次出现位置(枚举超时,二分实现)。
代码:
#include <iostream>
#include <cstdio>
#include <algorithm>
#include <cstring>
#include<cmath>
#include<string>
using namespace std;
const int MAXN=1e5+1000;
int n;
//后缀数组部分
struct SA{
int sa[MAXN];
int t1[MAXN],t2[MAXN],c[MAXN];
int rank1[MAXN],height[MAXN];
int st[20][MAXN];
void build_sa(int s[],int n,int m)
{
int i,j,p,*x=t1,*y=t2;
for(i=0;i<m;i++)c[i]=0;
for(i=0;i<n;i++)c[x[i]=s[i]]++;
for(i=1;i<m;i++)c[i]+=c[i-1];
for(i=n-1;i>=0;i--)sa[--c[x[i]]]=i;
for(j=1;j<=n;j<<=1)
{
p=0;
for(i=n-j;i<n;i++)y[p++]=i;
for(i=0;i<n;i++)if(sa[i]>=j)y[p++]=sa[i]-j;
for(i=0;i<m;i++)c[i]=0;
for(i=0;i<n;i++)c[x[y[i]]]++;
for(i=1;i<m;i++)c[i]+=c[i-1];
for(i=n-1;i>=0;i--)sa[--c[x[y[i]]]]=y[i];
swap(x,y);
p=1;x[sa[0]]=0;
for(i=1;i<n;i++)
x[sa[i]]=y[sa[i-1]]==y[sa[i]] && y[sa[i-1]+j]==y[sa[i]+j]?p-1:p++;
if(p>=n)break;
m=p;
}
}
void getHeight(int s[],int n)
{
int i,j,k=0;
for(i=0;i<=n;i++)rank1[sa[i]]=i;
for(i=0;i<n;i++)
{
if(k)k--;
j=sa[rank1[i]-1];
while(s[i+k]==s[j+k])k++;
height[rank1[i]]=k;
}
}
void build_st()
{
int i, k;
for(i=1;i<=n;i++)st[0][i]=height[i];
for(k=1;k<=20;k++)
for(i=1;i+(1<<k)-1<=n;i++)
st[k][i]=min(st[k-1][i],st[k-1][i+(1<<k-1)]);
}
int lcp(int x, int y)
{
int l=rank1[x], r=rank1[y];
if(l>r)swap(l,r);
if(l==r)return n-sa[l];
int t=log2(r-l);
return min(st[t][l+1],st[t][r-(1<<t)+1]);
}
}sa;
int s[MAXN];
char p[MAXN];
//主席树部分 求区间第k大
struct t{
int l,r,num;
}tree[MAXN*40];
int root[MAXN],tot;
int sz=1e5+100;
void update(int l,int r,int &x,int y,int pos)
{
tree[++tot]=tree[y];x=tot;tree[x].num++;
if(l==r )return ;
int m=(l+r)>>1;
if(pos<=m) update(l,m,tree[x].l,tree[y].l,pos);
else update(m+1,r,tree[x].r,tree[y].r,pos);
}
int query(int l,int r,int x,int y,int k){
if(l==r) return l;
int m=(l+r)>>1;
int tmp=tree[tree[y].l].num-tree[tree[x].l].num;
if(tmp<k) return query(m+1,r,tree[x].r,tree[y].r,k-tmp);
else return query(l,m,tree[x].l,tree[y].l,k);
}
//获得左右区间
int getl(int l,int r,int len,int p)
{
int ans;
while(l<=r)
{
int m=(l+r)>>1;
if(sa.lcp(p,sa.sa[m])>=len){//大于子串长度此后缀中包含子串
ans=m;
r=m-1;
}
else l=m+1;
}
return ans;
}
int getr(int l,int r,int len,int p)
{
int ans;
while(l<=r){
int m=(l+r)>>1;
if(sa.lcp(p,sa.sa[m])>=len){
ans=m;
l=m+1;
}
else r=m-1;
}
return ans;
}
int main()
{
int kase;
scanf("%d",&kase);
while(kase--)
{
int q;
tot=0;
scanf("%d%d",&n,&q);
scanf("%s",p);
for(int i=0;i<n;i++)
s[i]=p[i]-'a'+1;
s[n]=0;
sa.build_sa(s,n+1,30);
sa.getHeight(s,n);
sa.build_st();
for(int i=1;i<=n;i++){
update(1,sz,root[i],root[i-1],sa.sa[i]+1);
}
while(q--)
{
int l,r,k;
scanf("%d%d%d",&l,&r,&k);
int len=r-l+1;
l--;
int t=l;
l=getl(1,sa.rank1[t],len,t);
r=getr(sa.rank1[t],n,len,t);
int tmp=query(1,sz,root[l-1],root[r],k);
printf("%d\n",tmp==sz?-1:tmp);//等于右区间时不存在 也可以判断区间长度
}
}
return 0;
}