HDU6194(后缀数组)

本文介绍了一种使用后缀数组和ST表解决特定字符串问题的方法:求字符串中有多少不同的子串恰好出现了k次。通过构建后缀数组、计算高度数组并利用ST表快速查询区间最小值来解决该问题。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

题意:告诉你一个字符串和k , 求这个字符串中有多少不同的子串恰好出现了k 次。

解题思路:先用后缀数组进行算出height,然后用ST表维护,然后用区间长为k进行查询,找出最小的height,目的是为了找出k都有的字符串长度,然后区间往左右分别扩展一个单位,目的是看看左右的重复情况,左右的最大值,代表超出K的范围。要注意K=1时是一种特殊情况,具体看代码理解,已经注释。

#include<cstdio>
#include<cstring>
#include<algorithm>
#include<cmath>
#include<iostream>
#define N 505000
using namespace std;
char s[N];
int sa[N],t1[N],t2[N],c[N],rnk[N],height[N],n,p[N][30];
void build_sa(int m)
{
	int *x = t1, *y = t2;
	for(int i=0; i<m; i++) c[i] = 0;
	for(int i=0; i<n; i++) c[x[i] = s[i]]++;
	for(int i=1;i<m;i++) c[i]+=c[i-1];//桶 
	for(int i=n-1;i>=0;i--) sa[--c[x[i]]]=i;
	for(int k=1; k<=n; k = k<<1)
	{
		int p = 0;
		//y是用来给第二关键字排序的 
		for(int i=n-k; i<n; i++) y[p++] = i; //后面几个第二关键字都没有,自然是最小的,排在前面 
		for(int i=0; i<n; i++) if(sa[i] >= k) y[p++] = sa[i]-k;//第二关键字的位置本来是sa[i],-k之后就变成它对应第一关键字的位置(直边所指) 
		for(int i=0; i<m; i++) c[i] = 0;//清空桶,要开始基数排序了 
		for(int i=0; i<n; i++) c[x[y[i]]]++;
		for(int i=0; i<m; i++) c[i] += c[i-1];
		for(int i=n-1; i>=0; i--) sa[--c[x[y[i]]]] = y[i];
		swap(x,y);
		p = 1; x[sa[0]] = 0;//从0开始赋值 
		for(int i=1; i<n; i++)//如果说第一关键字和第二关键字都和前面相同,那就给一个和前面一样的键值,否则就给一个新的更高的键值 
            x[sa[i]] = y[sa[i-1]] == y[sa[i]] && y[sa[i-1]+k] == y[sa[i]+k] ? p-1 : p++;
        if(p >= n) break;//已经分出胜负了,各不相同 
        m = p;
	} 
}
void getheight()
{
	int i,j,k = 0;
	for(int i=0; i<n; i++)  rnk[sa[i]] = i;
	for(i = 0; i < n; i++)
	{
		if(k) k--;//h[i]>=h[i-1]-1 
		if(rnk[i] == 0)
		{
			height[rnk[i]] = 0;
			continue;
		}
		j = sa[rnk[i]-1];
		while(s[i+k] == s[j+k]) k++;
		height[rnk[i]] = k;
	}
}
void build_st()
{
	for(int i=1;i<n;i++) p[i][0]=height[i];//必须从1开始,代表第一位 
	for(int j=1;j<=29;j++)
	{
		for(int i=1;i+(1<<j)-1<n;i++)
		{
			p[i][j]=min(p[i][j-1],p[i+(1<<(j-1))][j-1]);
		}
	}
} 
int query(int l,int r)
{
	if(l>r) return n-sa[r]-1;//真的算的时候,要把最后0给除掉,因为本来这个0就是多余添加的,不除外就是当这个0是一开始就在字符串中了 
	int k=log2(r-l+1);
	//cout<<k<<" "<<l<<" "<<r<<"*"<<endl;
	return min(p[l][k],p[r-(1<<k)+1][k]);
}
int main()
{
	freopen("t.txt","r",stdin);
	int T,k;
	scanf("%d",&T);
	while(T--)
	{
		scanf("%d",&k);
		scanf("%s",s);
		n=strlen(s);
		s[n++]=0;
		build_sa(128);
		getheight();
		for(int i=0;i<n;i++) printf("%d ",height[i]);
		printf("\n");
		build_st();
		int ans=0;
		k--;
		for(int i=1;i<n-k+1;i++)
		{
			int l=i,r=i+k-1;
            int len=query(l,r);
            int more=max((l>1?query(l-1,r):0),(r<n-1?query(l,r+1):0));
            ans+=max(0,(len-more));
		}
		printf("%d\n",ans);
	}
	return 0;
}

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值