题意:给一个串,找出至少出现m次的最长子串。
思路:基于哈希值的LCP算法。从白书上学来的,真是一个神奇的技能。。利用后缀哈希H[i]=H[i+1]x+s[i],为每个长度为l的字符串计算一个哈希值,就可以在O(1)的时间内比较两个子串。
#include <iostream>
#include <stdio.h>
#include <cmath>
#include <algorithm>
#include <iomanip>
#include <cstdlib>
#include <string>
#include <string.h>
#include <vector>
#include <queue>
#include <stack>
#include <map>
#include <set>
#include <ctype.h>
#include <sstream>
#define INF 1000000000
#define ll long long
#define min3(a,b,c) min(a,min(b,c))
#define max3(a,b,c) max(a,max(b,c))
using namespace std;
int m;
char str[40010];
int siz;
unsigned long long hash[40010];
unsigned long long H[40010],xn[40010];
int rank[40010];
bool cmp(const int& a,const int& b){
return hash[a]<hash[b]||(hash[a]==hash[b]&&a<b);
}
int judge(int ans){
for(int i=0;i<=siz-ans;i++){
hash[i]=H[i]-H[i+ans]*xn[ans];
rank[i]=i;
}
sort(rank,rank+siz-ans+1,cmp);
int c=0;
int pos=-1;
for(int i=0;i<=siz-ans;i++){
if(i==0||hash[rank[i]]!=hash[rank[i-1]])c=0;
if(++c>=m)pos=max(pos,rank[i]);
}
return pos;
}
int main(){
const int x=123;
xn[0]=1;
for(int i=1;i<=40000;i++)xn[i]=xn[i-1]*x;
while(cin>>m){
if(!m)break;
memset(H,0,sizeof(H));
scanf("%s",str);
siz=strlen(str);
for(int i=siz-1;i>=0;i--){
H[i]=H[i+1]*x+str[i]-'a';
}
int l=1;
int r=siz-m+1;
int ans,pos=-1;
while(l<=r){
int mid=(l+r)/2;
int tmp=judge(mid);
if(tmp!=-1){
l=mid+1;
ans=mid;
pos=tmp;
}else{
r=mid-1;
}
}
if(pos!=-1){
cout<<ans<<" "<<pos<<endl;
}else{
cout<<"none"<<endl;
}
}
return 0;
}