题意:给一个N项的序列(1<=N <= 20,000,每一项是不超过1,000,000的自然数),求至少出现K次的子串的最大长度,出现位置允许重叠。
嗯,满早他们就说这个题目是后缀数组,然后我当时还不会,学了几天嗯,学会了吧。。唉,后缀数组这个东西真的是细节多如麻~。然后当时学妹就用hash过了。嗯,
chrt的hash
有兴趣的可以看一下,虽然跑得比后缀数组慢但是代码短易于实现。
这个题目就是二分可能的长度,然后每次验证就可以了。嗯,于是验证的时候就用后缀数组暴力验证吧,头痛欲裂。不想分析时间复杂度这些东西了。直接贴代码吧,等有机会再详细解释吧。
代码:
#include <iostream>
#include <cstring>
#include <cstdio>
#include <string>
const int MAXN = 100005;
using namespace std;
int s[MAXN];
int sa[MAXN],r[MAXN],t[MAXN],t2[MAXN],c[MAXN],h[MAXN],n,k;
inline void build_sa(int m)
{
int *x = t,*y = t2;
for(int i = 0;i < m;i++) c[i] = 0;
for(int i = 0;i < n;i++) c[x[i] = s[i]]++;
for(int i = 0;i < m;i++) c[i] += c[i-1];
for(int i = n - 1;i >= 0;i--) sa[--c[x[i]]] = i;
for(int k = 1;k <= n;k <<= 1){
int p = 0;
for(int i = n - k;i < n;i++) y[p++] = i;
for(int i = 0;i < n;i++) if(sa[i] >= k) y[p++] = sa[i] - k;
for(int i = 0;i < m;i++) c[i] = 0;
for(int i = 0;i < n;i++) c[x[y[i]]]++;
for(int i = 0;i < m;i++) c[i] += c[i-1];
for(int i = n - 1;i >= 0;i--) sa[--c[x[y[i]]]] = y[i];
swap(x,y);
p = 1;x[sa[0]] = 0;
for(int i = 1;i < n;i++)
x[sa[i]] = y[sa[i-1]] == y[sa[i]] && y[sa[i-1]+k] == y[sa[i]+k] ? p - 1 : p++;
if(p >= n) break;
m = p;
}
}
inline void build_Height()
{
int i,j,k = 0;
for(i = 0;i < n;i++) r[sa[i]] = i;
for(i = 0;i < n;i++)
{
if(k) k--;
j = sa[r[i] - 1];
while(s[i+k] == s[j + k]) ++k;
h[r[i]] = k;
}
}
inline bool check(int M){
int cnt = 1;
for(int i = 1;i < n;i++){
if(h[i] >= M){
if(++cnt >= k) return true;
} else {
cnt = 1;
}
}
return cnt >= k;
}
int main()
{
scanf("%d %d",&n,&k);
for(int i = 0;i < n;i++)
scanf("%d",&s[i]),
++s[i];
n++;
build_sa(256);
build_Height();
int L = 1,R = n,ans;
while(L <= R){
int M = (L+R) >> 1;
if(check(M)) L = M + 1,ans = M;
else R = M - 1;
}
cout<<ans;
return 0;
}