K-th occurrence HDU - 6704 (主席树+后缀数组+二分)

本文介绍了一种高效的子串查找方法,通过结合后缀数组和主席树,快速定位字符串中特定子串的第k次出现位置。后缀数组用于排序和比较字符串的后缀,主席树则负责在指定区间内找到第k大的元素。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

题目传送

题意:给出一个字符串,找出某个子串第k次出现的位置

思路:后缀数组sa[i]数组表示排名第i的后缀第一次出现的下标,求第k次出现的下标只需要在某个区间中求sa数组中的第k大即可(主席树求第k大),确定区间时利用后缀数组中的lcp确定与子串具有相同前缀的后缀第一次出现位置和最后一次出现位置(枚举超时,二分实现)。

代码:

#include <iostream>
#include <cstdio>
#include <algorithm>
#include <cstring>
#include<cmath>
#include<string>
using namespace std;
const int MAXN=1e5+1000;
int n;
//后缀数组部分 
struct SA{
	int sa[MAXN];
	int t1[MAXN],t2[MAXN],c[MAXN];
	int rank1[MAXN],height[MAXN];
	int st[20][MAXN];
	void build_sa(int s[],int n,int m)
	{
	    int i,j,p,*x=t1,*y=t2;
	    for(i=0;i<m;i++)c[i]=0;
	    for(i=0;i<n;i++)c[x[i]=s[i]]++;
	    for(i=1;i<m;i++)c[i]+=c[i-1];
	    for(i=n-1;i>=0;i--)sa[--c[x[i]]]=i;
	    for(j=1;j<=n;j<<=1)
	    {
	        p=0;
	        for(i=n-j;i<n;i++)y[p++]=i;
	        for(i=0;i<n;i++)if(sa[i]>=j)y[p++]=sa[i]-j;
	        for(i=0;i<m;i++)c[i]=0;
	        for(i=0;i<n;i++)c[x[y[i]]]++;
	        for(i=1;i<m;i++)c[i]+=c[i-1];
	        for(i=n-1;i>=0;i--)sa[--c[x[y[i]]]]=y[i];
	        swap(x,y);
	        p=1;x[sa[0]]=0;
	        for(i=1;i<n;i++)
	            x[sa[i]]=y[sa[i-1]]==y[sa[i]] && y[sa[i-1]+j]==y[sa[i]+j]?p-1:p++;
	        if(p>=n)break;
	        m=p;
	    }
	}
	void getHeight(int s[],int n)
	{
	    int i,j,k=0;
	    for(i=0;i<=n;i++)rank1[sa[i]]=i;
	    for(i=0;i<n;i++)
	    {
	        if(k)k--;
	        j=sa[rank1[i]-1];
	        while(s[i+k]==s[j+k])k++;
	        height[rank1[i]]=k;
	    }
	}
	void build_st()   
	{
	    int i, k;
	    for(i=1;i<=n;i++)st[0][i]=height[i];
	    for(k=1;k<=20;k++)
	         for(i=1;i+(1<<k)-1<=n;i++)
	            st[k][i]=min(st[k-1][i],st[k-1][i+(1<<k-1)]);
	 }
	int lcp(int x, int y)
	{
	    int l=rank1[x], r=rank1[y];
	    if(l>r)swap(l,r);
	    if(l==r)return n-sa[l];
	    int t=log2(r-l);
	    return min(st[t][l+1],st[t][r-(1<<t)+1]);
	}
}sa;
int s[MAXN];
char p[MAXN];
//主席树部分 求区间第k大 
struct t{
	int l,r,num;
}tree[MAXN*40]; 
int root[MAXN],tot;
int sz=1e5+100;
void update(int l,int r,int &x,int y,int pos)
{
	tree[++tot]=tree[y];x=tot;tree[x].num++;
	if(l==r )return ;
	int m=(l+r)>>1;
	if(pos<=m) update(l,m,tree[x].l,tree[y].l,pos);
	else update(m+1,r,tree[x].r,tree[y].r,pos);
}
int query(int l,int r,int x,int y,int k){
	if(l==r) return l;
	int m=(l+r)>>1;
	int tmp=tree[tree[y].l].num-tree[tree[x].l].num;
	if(tmp<k) return query(m+1,r,tree[x].r,tree[y].r,k-tmp);
	else return query(l,m,tree[x].l,tree[y].l,k);
}
//获得左右区间 
int getl(int l,int r,int len,int p)
{
	int ans;
	while(l<=r)
	{
		int m=(l+r)>>1;
		if(sa.lcp(p,sa.sa[m])>=len){//大于子串长度此后缀中包含子串
			ans=m;
			r=m-1;
		}
		else l=m+1;
	}
	return ans;
 } 
 int getr(int l,int r,int len,int p)
{
	int ans;
	while(l<=r){
		int m=(l+r)>>1;
		if(sa.lcp(p,sa.sa[m])>=len){
			ans=m;
			l=m+1;
		}
		else r=m-1;
	}
	return ans;
} 
int main()
{
	int kase;
	scanf("%d",&kase);
	while(kase--)
	{
		int q;
		tot=0;
		scanf("%d%d",&n,&q);
		scanf("%s",p);
		for(int i=0;i<n;i++)
			s[i]=p[i]-'a'+1;
		s[n]=0;
		sa.build_sa(s,n+1,30);
		sa.getHeight(s,n);
		sa.build_st();
		for(int i=1;i<=n;i++){
			update(1,sz,root[i],root[i-1],sa.sa[i]+1);
		}
		while(q--)
		{
			int l,r,k;
			scanf("%d%d%d",&l,&r,&k);
			int len=r-l+1;
			l--;
			int t=l;
			l=getl(1,sa.rank1[t],len,t);
			r=getr(sa.rank1[t],n,len,t);
			int tmp=query(1,sz,root[l-1],root[r],k);
			printf("%d\n",tmp==sz?-1:tmp);//等于右区间时不存在 也可以判断区间长度 
		}
	 } 
	return 0;
}

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值