后缀数组 (caioj)总结(?)

本文是对后缀数组算法的总结,包括基础的倍增算法和基数排序实现。通过分析caioj系列题目,探讨了后缀数组在解决不可重叠最长重复子串、可重叠k次最长重复子串、最长公共子串以及寻找多数字符串共有的子串等问题上的应用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

对后缀数组的一个总结吧
(听说以后不学了???)
基础算法:倍增算法+基数排序

后缀:

caioj1180: [视频]后缀数组【模板】后缀排序

题目描述
给出一个字符串,把这个字符串的所有非空后缀从小到大排序后,按顺序输出后缀的第一个字符在原串中的位置。

#include<cstdio>
#include<iostream>
#include<cstring>
#include<algorithm>
#include<cmath>
using namespace std;
int a[1100000],tt[1100000];
char ss[1100000];
int Rank[1100000],sa1[1100000],Rank2[1100000],sa2[1100000];
//Rank[i]名次数组:从第i个开始的后缀排第几?
//sa[i]后缀数组:排第i的后缀是从哪里开始的? 后面的数字表示按第几关键字排序的 
int Rsort[1100000];
void get_sa(int n,int m)
{
    memcpy(Rank,a,sizeof(Rank));
    //预处理第一关键字的排名:对长度为1的字符串进行基数排序,求出sa1 
    memset(Rsort,0,sizeof(Rsort));
    for(int i=1;i<=n;i++)Rsort[Rank[i]]++;
    for(int i=1;i<=m;i++)Rsort[i]+=Rsort[i-1];
    for(int i=n;i>=1;i--)sa1[Rsort[Rank[i]]--]=i;//倒着排是为了让在后面的排名大

    int ln=1,p=0;//ln为已经处理好的子串的长度,p表示有多少不相同的子串
    while(p<n)//现在处理的是长度为ln*2的子串,开始将两个关键字合并排序
    //为啥不写ln<=n?因为有可能不需要排到ln=n就排完了,而当p==n就说明全部字符串不同,后面再也不会改变
    {
        int k=0;//处理第二关键字的排名:
        for(int i=n-ln+1;i<=n;i++)sa2[++k]=i;//如果长度不够ln的话要补0.先把要补0的后缀处理好,长度短他们肯定在前面 
        for(int i=1;i<=n;i++)//sa1[i]是sa1[i]-ln的第二关键字,因为我们枚举的是第二关键字的排名 
            if(sa1[i]-ln>0)sa2[++k]=sa1[i]-ln;//如果第一关键字减去ln>0说明第二关键字存在。sa2记录sa1[i]-ln的第二关键字的排名,指向sa1[i]-ln 

        //基数排序,根据第二关键字的排序再找出第一关键字的
        memset(Rsort,0,sizeof(Rsort));
        for(int i=1;i<=n;i++)Rsort[Rank[i]]++;
        for(int i=1;i<=m;i++)Rsort[i]+=Rsort[i-1]; 
        for(int i=n;i>=1;i--)sa1[Rsort[Rank[sa2[i]]]--]=sa2[i];

        for(int i=1;i<=n;i++)tt[i]=Rank[i];//由于Rank会改变,判断不了一、二关键字是否相等,复制多一份
        //用sa得到新的Rank数组,为什么预处理的时候不能求出Rank?因为原来的Rank没有两个关键字
        p=1;Rank[sa1[1]]=1;
        for(int i=2;i<=n;i++)
        {
            if( tt[sa1[i]]!=tt[sa1[i-1]] || tt[sa1[i]+ln]!=tt[sa1[i-1]+ln] )p++;
            //只要一二关键字其中一个不同,前后的字符串不同 
            Rank[sa1[i]]=p;
        } 
        m=p;ln*=2;
    }
    for(int i=1;i<n;i++)printf("%d ",sa1[i]);
    printf("%d\n",sa1[n]);
}
int main()
{
    scanf("%s",ss+1);
    int n=strlen(ss+1);
    for(int i=1;i<=n;i++)a[i]=ss[i]-'a'+1;
    get_sa(n,30);
    return 0;
}

实现:

caioj1467: 后缀数组1:不可重叠最长重复子串

题意:有N(1 <= N <=20000)个音符的序列来表示一首乐曲,每个音符都是1..88范围内的整数,现在要找一个重复的主题。“主题”是整个音符序列的一个子串,它需要满足如下条件:
1.长度至少为5个音符。
2.在乐曲中重复出现。(可能经过转调,“转调”的意思是主题序列中每个音符都被加上或减去了同一个整数值)
3.重复出现的同一主题不能有公共部分。

#include<cstdio>
#include<iostream>
#include<cstring>
#include<cstdlib>
#include<algorithm>
#include<cmath>
using namespace std;
int a[21000],tt[21000];
char ss[21000];
int Rank[21000],sa1[21000],sa2[21000];
int Rsort[21000];
void get_sa(int n,int</
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值