poj3261(后缀数组+二分)

本文介绍了一种寻找字符串中至少出现k次的最长重复子串的算法,采用二分查找结合后缀数组的方法,适用于字符串处理及算法优化等领域。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

给定一个字符串,求至少出现 k 次的最长重复子串,这 k 个子串可以重叠。

二分长度,也是分组判定是否出现了k次,实际就是有没有组大于k的长度


#include<cstdio>
#include<cstring>
#include<cmath>
#include<cstdlib>
#include<algorithm>
using namespace std;
const int N=20005;
const int inf=0x3f3f3f3f;
int c[N*50],t1[N],t2[N],s[N],sa[N],height[N],rank[N],n,k;
void build_sa()
{
	int m=1000005,*x=t1,*y=t2;
	for (int i=0;i<m;i++) c[i]=0;
	for (int i=0;i<n;i++) c[x[i]=s[i]]++;
	for (int i=1;i<m;i++) c[i]+=c[i-1];
	for (int i=n-1;i>=0;i--) sa[--c[x[i]]]=i;
	
	for (int k=1;k<=n;k<<=1)
	{
		int p=0;
		for (int i=n-k;i<n;i++) y[p++]=i;
		for (int i=0;i<n;i++) if (sa[i]>=k) y[p++]=sa[i]-k;
		
		for (int i=0;i<m;i++) c[i]=0;
		for (int i=0;i<n;i++) c[x[y[i]]]++;
		for (int i=1;i<m;i++) c[i]+=c[i-1];
		for (int i=n-1;i>=0;i--) sa[--c[x[y[i]]]]=y[i];
		swap(x,y);
		x[sa[0]]=0;p=1;
		for (int i=1;i<n;i++)
		x[sa[i]]=y[sa[i]]==y[sa[i-1]]&&y[sa[i]+k]==y[sa[i-1]+k]?p-1:p++;
		if (p>=n) break;
		m=p; 
	}
}
void build_height()
{
	int k=0;
	for (int i=0;i<n;i++) rank[sa[i]]=i;
	for (int i=0;i<n-1;i++)
	{
		if (k) k--;
		int j=sa[rank[i]-1];
		while (s[j+k]==s[i+k]) k++;
		height[rank[i]]=k;
	}
}
bool pan(int mid)
{
	int t=0,h=inf;
	for (int i=1;i<n;i++)
	{
		h=min(h,height[i]);
		if (h<mid)
		{
			h=inf;t=1;
			if (t>=k) return true;
			continue;
		}
		t++;
		if (t>=k) return true;
	}
	return false;
}
int main()
{
	scanf("%d%d",&n,&k);
	for (int i=0;i<n;i++) scanf("%d",&s[i]),s[i]++;
	s[n++]=0;
	build_sa();
	build_height();
	int l=0,r=n,mid,ans=0;
	while (l<=r)
	{
		mid=(l+r)>>1;
		if (pan(mid)) ans=mid,l=mid+1;
		else r=mid-1;
	}
	printf("%d",ans);
	return 0;
}


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值