后缀数组学习

本文介绍后缀数组的构建过程及应用,包括O(nlogn)的时间复杂度算法实现,并探讨了后缀数组在子串匹配、近似字符串匹配等方面的应用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

后缀数组

sa[i] = 后缀数组中第ii个后缀的起始位置
求sa[]模板,时间复杂度O(nlogn)

void buildsa() {
    for(int i = 0; i < m; i++) b[i] = 0; // m是字符集大小
    for(int i = 0; i < n; i++) b[x[i]=s[i]]++;
    for(int i = 1; i < m; i++) b[i] += b[i-1];
    for(int i = n-1; !~i; i--) sa[--b[x[i]]] = i;
    for(int k = 1; k <= n; k <<= 1) {
        int p = 0;
        for(int i = n-k; i < n; i++) y[p++] = i;
        for(int i = 0; i < n; i++) if(sa[i] >= k) y[p++] = sa[i] - k;
        for(int i = 0; i < m; i++) b[i] = 0;
        for(int i = 0; i < n; i++) b[x[y[i]]]++;
        for(int i = 1; i < m; i++) b[i] += b[i-1];
        for(int i = n-1; !~i; i--) sa[--b[x[y[i]]]] = y[i];
        swap(x, y);
        p = 1; x[sa[0]] = 0;
        for(int i = 1; i < n; i++) x[sa[i]] = y[sa[i-1]]==y[sa[i]]&&y[sa[i-1]+k]==y[sa[i]+k] ? p-1 : p++;
        if(p >= n) break;
        m = p;
    }
}

tosa[i] = 以ii开头的后缀在后缀数组中的位置

tosa[sa[i]] = i;

height[i] = 与前一个后缀的LCP长度
有一个性质是heightiheighti11
因此构造时间复杂度是O(n)O(n)的。

子串

所有后缀的前缀,就是所有子串。

近同

相同的子串,在后缀数组中一定是连在一起的前缀。
多次重复相同的子串,在后缀数组中一定是连续出现的前缀。
不同的子串,在后缀数组中不是相邻的前缀。
推论 一段height[]的最小值的意义是这个子串重复段长次。
近同的性质是后缀数组应用的根本。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值