转自:《后缀数组---处理字符串的有力工具》
题目大意:要求求一个字符串中不同子串的个数
解题思路:利用后缀数组,每个子串一定是某个后缀子串的前缀,求多少个不同的子串等价于求出所有后缀之间的不相同的前缀的个数。
设字符串为str,sa[i]表示排名第i的后缀从str的第sa[i]个位置开始,rank[i]表示str[i]开始的后缀排第几位
height[i]表示sa[i]和sa[i-1]的公共前缀为多少。
按照suffix(sa[1]), suffix(sa[2]),....suffix(sa[n])的顺序计算,每加入一个suffix(sa[i]),就产生n - sa[i] + 1个新前缀。其中height[i]个是和前面的后缀子串的前缀是相同的
所以suffix(sa[i])将贡献n-sa[i]+1-height[i]个不同的子串
#include <iostream>
#include <cstdio>
#include <cstring>
using namespace std;
const int maxn = 1010;
char str[maxn];
int wx[maxn], wy[maxn], c[maxn], height[maxn], sa[maxn], rank[maxn];
inline bool cmp(int *s, int a, int b, int l);
void suffix(char *s, int n, int m);
void cal_height(char *s, int *sa, int n);
int main()
{
int n;
scanf("%d", &n);
while(n-- != 0)
{
scanf("%s", str);
int len = strlen(str);
str[len] = 0;
suffix(str, len + 1, 26);
cal_height(str, sa, len);
int sum = 0;
for(int i = 2; i <= len; i++)
sum += len + 1 - sa[i] + 1 - height[i];
printf("%d\n", sum);
}
return 0;
}
inline bool cmp(int *s, int a, int b, int l)
{
return s[a] == s[b] && s[a + l] == s[b + l];
}
void suffix(char *s, int n, int m)
{
int *x = wx, *y = wy, *t, index;
for(int i = 0; i < m; i++)
c[i] = 0;
for(int i = 0; i < n; i++)
c[x[i] = s[i]]++;
for(int i = 1; i < m; i++)
c[i] += c[i-1];
for(int i = n - 1; i >= 0; i--)
sa[--c[s[i]]] = i;
for(int j = 1; j < n; j *= 2, m = index)
{
index = 0;
for(int i = n - j; i < n; i++)
y[index++] = i;
for(int i = 0; i < n; i++)
{
if(sa[i] >= j)
y[index++] = sa[i] - j;
}
for(int i = 0; i < m; i++)
c[i] = 0;
for(int i = 0; i < n; i++)
c[x[y[i]]]++;
for(int i = 1; i < m; i++)
c[i] += c[i-1];
for(int i = n - 1; i >= 0; i--)
sa[--c[x[y[i]]]] = y[i];
t = x; x = y; y = t;
x[sa[0]] = rank[sa[0]] = 0;
index = 1;
for(int i = 1; i < n; i++)
{
if(j * 2 < n)
x[sa[i]] = cmp(y, sa[i-1], sa[i], j) ? index - 1 : index++;
else
rank[sa[i]] = cmp(y, sa[i-1], sa[i], j) ? index - 1 : index++;
}
}
}
void cal_height(char *s, int *sa, int n)
{
int k = 0;
for(int i = 0; i < n; height[rank[i]] = k)
{
if(k != 0)
k--;
for(int j = sa[rank[i] - 1]; s[i + k] == s[j + k]; k++);
}
}