作为 drd 的好朋友,技术男 atm 在 drd 生日时送给他一个超长字符串 S 。atm 要 drd 在其中找出一个最长的字符串 T ,使得 T 在 S 中至少出现了两次,而他想说的秘密就藏在 T 中。
由于字符串实在是太长了,drd 总是找不到合适的 T 。于是 drd 请你帮他找到这个 T 的长度。
【输入格式】
一行。一个字符串,即题目中说的S 。
【输出格式】
一行。一个整数,表示最长的 T 的长度。
【样例输入】
ababa
【样例输出】
3
「数据范围」
对于 30% 的数据,S长度 <= 100
对于 60% 的数据,S长度 <= 8000
对于 100% 的数据,S长度 <= 500000
资源约定:
峰值内存消耗 < 256M
CPU消耗 < 1000ms
经典的longest repeated substring问题
使用后缀数组suffix array解决
参考<<算法竞赛入门经典—训练指南>>上的代码,采用nlog(n)(基数排序)才行
如使用nlog(n)*log(n) (快速排序),则8,9,10三个测试点超时1s
#include <bits/stdc++.h>
using namespace std;
const int MAXN = 1E6;
char s[MAXN];
int sa[MAXN], t[MAXN], t2[MAXN], c[MAXN], n, rk[MAXN], height[MAXN];
void build_sa(int m)
{
int *x = t;
int *y = t2;
for (int i = 0; i < m; i++) c[i] = 0;
for (int i = 0; i < n; i++) c[x[i] = s[i]]++;
for (int i = 1; i < m; i++) c[i] += c[i - 1];
for (int i = n - 1; i >= 0; i--) sa[--c[x[i]]] = i;
for (int k = 1; k <= n; k *= 2) {
int p = 0;
for (int i = n - k; i < n; i++) y[p++] = i;
for (int i = 0; i < n; i++)
if (sa[i] >= k) y[p++] = sa[i] - k;
for (int i = 0; i < m; i++) c[i] = 0;
for (int i = 0; i < n; i++) c[x[y[i]]]++;
for (int i = 0; i < m; i++) c[i] += c[i - 1];
for (int i = n - 1; i >= 0; i--) sa[--c[x[y[i]]]] = y[i];
swap(x, y);
p = 1;
x[sa[0]] = 0;
for (int i = 1; i < n; i++)
x[sa[i]] = y[sa[i-1]] == y[sa[i]] && y[sa[i-1] + k] == y[sa[i] + k] ? p - 1 : p++;
if (p >= n) break;
m = p;
}
}
void getHeight()
{
int k = 0;
for (int i = 0; i < n; i++) rk[sa[i]] = i;
for (int i = 0; i < n; i++) {
if (k) k--;
int j = sa[rk[i] - 1];
while(s[i+k] == s[j+k]) k++;
height[rk[i]] = k;
}
}
int main()
{
//freopen("in1.txt", "r", stdin);
scanf("%s", s);
strcat(s, "$");
n = strlen(s);
build_sa(256);
getHeight();
int ans = 0;
for (int i = 0; i < n; i++)
ans = max(ans, height[i]);
cout << ans << endl;
}
809

被折叠的 条评论
为什么被折叠?



