题意:
给定若干字符串(这些字符串总长 ≤ 400000 ),在每个字符串中求出所有既是前缀又是后缀的子串长度。
例如:ababcababababcabab,既是前缀又是后缀的:ab,abab,ababcabab,ababcababababcabab。
题解:
使用kmp算法。我们知道next[i]是i之前的子字符串中相同前缀和后缀的最长长度。则可以这么考虑:从next[str.size()]开始,next[str.size()]的值就是整个字符串前缀和后缀的最长长度,令其为k,len为str.size(),则0~k-1和len-k~len-1都一样。则这个是答案。然后因为0~k-1==len-k~len-1,令len=k,则对于这个0~k-1子字符串中,其必存在和原字符串相同的后缀。可以这么证明。
如果k>len/2则len-k~k-1在前后缀中重叠。如abcabcabc,能推出字符串一定存在一个以上周期且非重叠部分各占一个周期。
如果k=len/2则刚好两个周期。
如果k<len/2则在0~k-1的子串中,存在和原字符串后缀相同的后缀。
然后一直递归令len=k;k=next[len]直到k==0,逆序输出即得结果。
AC代码:
#include <iostream>
#include <string>
#include <cstring>
using namespace std;
int nextarray[400005];
int ans[400005];
void getnext(string &str)
{
memset(nextarray, 0, sizeof(nextarray));
int j = -1, k = 0;
nextarray[0] = -1;
while (k < str.size())
{
if (j == -1 || str[j] == str[k])
nextarray[++k] = ++j;
else
j = nextarray[j];
}
}
void solve(string &str)
{
int i = 0, j = str.size();
memset(ans, 0, sizeof(ans));
ans[i++] = str.size();
while (nextarray[j])
{
ans[i++] = nextarray[j];
j = nextarray[j];
}
for (int k = i - 1; k >= 0; --k)
{
cout << ans[k];
if (k > 0)
cout << " ";
}
cout << endl;
}
int main()
{
string a;
while (cin >> a)
{
getnext(a);
solve(a);
}
return 0;
}