题意:
给定一个数m,一个字符串s,求s中至少出现m次的最长子串长度,并输出位置最靠后的对应子串的下标;串长度<=40000
分析:
构造后缀数组;
先二分答案mid,然后检查高度数组(LCP)中是否有连续的mid个数大于m;
有则L=mid,没有则R=mid-1;
复杂度O(n*(logn)^2+nlogn)
代码:
#include <cstdio>
#include <iostream>
#include <cstring>
#include <algorithm>
using namespace std;
const int Tmax=40005;
char s[Tmax];
int sa[Tmax],rk[Tmax],tmp[Tmax],lcp[Tmax];
int m,n,ans,k;
bool check(int x)
{
int i,time=0,sum=0;
for(i=1;i<=n;i++)
{
if(lcp[i]>=x) sum++;
else sum=0;
time=max(time,sum);
}
time++;
if(time<m) return false;
return true;
}
void work()
{
int l=0,r=n,mid;
while(l<r)
{
mid=(l+r+1)/2;
if(check(mid)==true) l=mid;
else r=mid-1;
}
if(l==r&&l>0) ans=l;
return;
}
int find()
{
int i,sum[Tmax],right=0;
bool ok=false;
sum[0]=0;
for(i=1;i<=n;i++)
{
if(lcp[i]>=ans) sum[i]=sum[i-1]+1;
else sum[i]=0;
}
i=n;
while(i>=0)
{
if(sum[i]>=m-1)
ok=true;
else if(sum[i]==0) ok=false;
if(ok==true)
{
right=max(right,sa[i]);
right=max(right,sa[i-1]);
}
i--;
}
return right;
}
bool cmp(int i,int j)
{
if(rk[i]!=rk[j]) return rk[i]<rk[j];
int ri=i+k<=n?rk[i+k]:-1;
int rj=j+k<=n?rk[j+k]:-1;
return ri<rj;
}
void suffix()
{
int i;
for(i=0;i<=n;i++)
{
sa[i]=i;
rk[i]=i<n?s[i]:-1;
}
for(k=1;k<=n;k*=2)
{
sort(sa,sa+1+n,cmp);
tmp[sa[0]]=0;
for(i=1;i<=n;i++)
{
tmp[sa[i]]=tmp[sa[i-1]];
if(cmp(sa[i-1],sa[i])==true) tmp[sa[i]]++;
}
for(i=0;i<=n;i++)
rk[i]=tmp[i];
}
return;
}
void get_lcp()
{
int i,j,h=0;
for(i=0;i<=n;i++)
{
if(h>0) h--;
j=sa[rk[i]-1];
while(i+h<=n-1&&j+h<=n-1&&s[i+h]==s[j+h]) h++;
lcp[rk[i]]=h;
}
return;
}
void run()
{
int i;
for(i=0;i<=n;i++)
printf("%2d ",sa[i]);
cout<<endl;
for(i=0;i<=n;i++)
printf("%2d ",rk[i]);
cout<<endl;
return;
}
int main()
{
while(scanf("%d",&m)==1&&m>0)
{
ans=0;
scanf("%s",s);
if(m==1)
{
printf("%d 0\n",strlen(s));
continue;
}
n=strlen(s);
suffix();
get_lcp();
work();
//run();
if(ans==0) printf("none\n");
else printf("%d %d\n",ans,find());
}
return 0;
}