后缀数组学习

最新推荐文章于 2022-02-24 12:53:39 发布

原创最新推荐文章于 2022-02-24 12:53:39 发布 · 286 阅读

0 ·

CC 4.0 BY-SA版权

本文介绍后缀数组的构建过程及应用，包括O(nlogn)的时间复杂度算法实现，并探讨了后缀数组在子串匹配、近似字符串匹配等方面的应用。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

后缀数组

sa[i] = 后缀数组中第 $i$ 个后缀的起始位置
求sa[]模板，时间复杂度 $O(n\log n)$

void buildsa() {
    for(int i = 0; i < m; i++) b[i] = 0; // m是字符集大小
    for(int i = 0; i < n; i++) b[x[i]=s[i]]++;
    for(int i = 1; i < m; i++) b[i] += b[i-1];
    for(int i = n-1; !~i; i--) sa[--b[x[i]]] = i;
    for(int k = 1; k <= n; k <<= 1) {
        int p = 0;
        for(int i = n-k; i < n; i++) y[p++] = i;
        for(int i = 0; i < n; i++) if(sa[i] >= k) y[p++] = sa[i] - k;
        for(int i = 0; i < m; i++) b[i] = 0;
        for(int i = 0; i < n; i++) b[x[y[i]]]++;
        for(int i = 1; i < m; i++) b[i] += b[i-1];
        for(int i = n-1; !~i; i--) sa[--b[x[y[i]]]] = y[i];
        swap(x, y);
        p = 1; x[sa[0]] = 0;
        for(int i = 1; i < n; i++) x[sa[i]] = y[sa[i-1]]==y[sa[i]]&&y[sa[i-1]+k]==y[sa[i]+k] ? p-1 : p++;
        if(p >= n) break;
        m = p;
    }
}