就 基于大老们的博客 研究了好久 才大概看明白 ( 然而并不明白能干嘛-----------------
最开始看懂的
加了一分个人理解 /**/的是自己写的 //是大老原来的
#include<iostream>
#include<cstdio>
#include<cstring>
#define rint register int
#define inv inline void
#define ini inline int
#define maxn 1000050
using namespace std;
char s[maxn];
int y[maxn],x[maxn],c[maxn],sa[maxn],rk[maxn],height[maxn],wt[30];
int n,m;
inv get_SA() {
for (rint i=1; i<=n; ++i)
++c[x[i]=s[i]];//c数组是桶 x[i]是第i个元素的第一关键字 /* c[?] 统计 s[i] 这个字符出现的次数 x[i] 代表这个后缀开始那一位是啥 */
for (rint i=2; i<=m; ++i) c[i]+=c[i-1];//做c的前缀和,我们就可以得出每个关键字最多是在第几名 /* 每个字符做开头时排第几 */
for (rint i=n; i>=1; --i) sa[c[x[i]]--]=i; /* sa为某个字符在对应区间上的位置 */
/* 举个例子 bcba abbc */
/* 1234 sa 4312 */
for (rint k=1; k<=n; k<<=1) {
rint num=0;
for (rint i=n-k+1; i<=n; ++i) y[++num]=i;//y[i]表示第二关键字排名为i的数,第一关键字的位置 /*这里是先制y的前k位是后面没有的也就是'\0'或者说是$ */
//第n-k+1到第n位是没有第二关键字的 所以排名在最前面
for (rint i=1; i<=n; ++i) if (sa[i]>k) y[++num]=sa[i]-k;
//排名为i的数 在数组中是否在第k位以后
//如果满足(sa[i]>k) 那么它可以作为别人的第二关键字,就把它的第一关键字的位置添加进y就行了
//所以i枚举的是第二关键字的排名,第二关键字靠前的先入队
for (rint i=1; i<=m; ++i) c[i]=0; //初始化c桶
for (rint i=1; i<=n; ++i) ++c[x[i]];//因为上一次循环已经算出了这次的第一关键字 所以直接加就行了
for (rint i=2; i<=m; ++i) c[i]+=c[i-1]; //第一关键字排名为1~i的数有多少个
for (rint i=n; i>=1; --i) sa[c[x[y[i]]]--]=y[i],y[i]=0;
//因为y的顺序是按照第二关键字的顺序来排的
//第二关键字靠后的,在同一个第一关键字桶中排名越靠后
//基数排序
swap(x,y);
//这里不用想太多,因为要生成新的x时要用到旧的,就把旧的复制下来,没别的意思
x[sa[1]]=1;
num=1;
for (rint i=2; i<=n; ++i)
x[sa[i]]=(y[sa[i]]==y[sa[i-1]] && y[sa[i]+k]==y[sa[i-1]+k]) ? num : ++num;
//因为sa[i]已经排好序了,所以可以按排名枚举,生成下一次的第一关键字
if (num==n) break;
m=num;
//这里就不用那个122了,因为都有新的编号了
}
//for (rint i=1; i<=n; ++i) putout(sa[i]),putchar(' ');
}
inv get_height() {/*高度数组为第i位和名次排在他前面的后缀的最长前缀数 而 h[i]>=h[i-1]-1 利用的是 第i-1位的字符串一定包含第i位的字符串*/
rint k=0;
for (rint i=1; i<=n; ++i) rk[sa[i]]=i;
for (rint i=1; i<=n; ++i) {
if (rk[i]==1) continue;//第一名height为0
if (k) --k;//h[i]>=h[i-1]-1;
rint j=sa[rk[i]-1];
while (j+k<=n && i+k<=n && s[i+k]==s[j+k]) ++k;
height[rk[i]]=k;//h[i]=height[rk[i]];
}
putchar(10);
}
int main() {
cin.getline(s+1,maxn-2);
n=strlen(s+1);
m=122;
//因为这个题不读入n和m所以要自己设
//n表示原字符串长度,m表示字符个数,ASCII('z')=122
//我们第一次读入字符直接不用转化,按原来的ascll码来就可以了
//因为转化数字和大小写字母还得分类讨论,怪麻烦的
get_SA();
int i;
printf("%d",sa[1]);
for(i=2;i<=n;i++)
printf(" %d",sa[i]);
//get_height();
}
另一个大佬的
这个就看了看高度数组那一块 反正是那一块看懂了 这个就没加注释
inline void suffixArray()
{
static int set[MAXN + 1], a[MAXN + 1];
std::copy(s + 1, s + n + 1, set + 1);
std::sort(set + 1, set + n + 1);
int *end = std::unique(set + 1, set + n + 1);
for (int i = 1; i <= n; i++) a[i] = std::lower_bound(set + 1, end, s[i]) - set;
static int fir[MAXN + 1], sec[MAXN + 1], tmp[MAXN + 1], buc[MAXN + 1];
for (int i = 1; i <= n; i++) buc[a[i]]++;
for (int i = 1; i <= n; i++) buc[i] += buc[i - 1];
for (int i = 1; i <= n; i++) rk[i] = buc[a[i] - 1] + 1;
for (int t = 1; t <= n; t *= 2)
{
for (int i = 1; i <= n; i++) fir[i] = rk[i];
for (int i = 1; i <= n; i++) sec[i] = i + t > n ? 0 : rk[i + t];
std::fill(buc, buc + n + 1, 0);
for (int i = 1; i <= n; i++) buc[sec[i]]++;
for (int i = 1; i <= n; i++) buc[i] += buc[i - 1];
for (int i = 1; i <= n; i++) tmp[n - --buc[sec[i]]] = i;
std::fill(buc, buc + n + 1, 0);
for (int i = 1; i <= n; i++) buc[fir[i]]++;
for (int i = 1; i <= n; i++) buc[i] += buc[i - 1];
for (int j = 1, i; j <= n; j++) i = tmp[j], sa[buc[fir[i]]--] = i;
bool unique = true;
for (int j = 1, i, last = 0; j <= n; j++)
{
i = sa[j];
if (!last) rk[i] = 1;
else if (fir[i] == fir[last] && sec[i] == sec[last]) rk[i] = rk[last], unique = false;
else rk[i] = rk[last] + 1;
last = i;
}
if (unique) break;
}
for (int i = 1, k = 0; i <= n; i++)
{
if (rk[i] == 1) k = 0;
else
{
if (k > 0) k--;
int j = sa[rk[i] - 1];
while (i + k <= n && j + k <= n && a[i + k] == a[j + k]) k++;
}
ht[rk[i]] = k;
}
}
感觉还是不太理解 争取以后自己写一个模板和博客出来吧…