HDU 5769 Substring(后缀数组)

本文介绍如何利用后缀数组解决求字符串中包含特定字符x的最长不重复子串的问题。通过构建后缀数组和高度数组,并结合字符串匹配技巧,实现高效的算法解决方案。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

题目分析

说实话前面之所以想搞后缀数组,一个是因为有了它,加上以前学的kmp和AC自动机,大部分的字符串的题目都可以解决了,第二就是看到了多校集训上面有后缀数组的题目,因此自己也向学习一下,毕竟多校的题目是区域赛的难度。
首先我们回忆一下前一天发的模板上讲的求单个子串的不重复子串个数,很明显对于每一个sa[i]后缀,它的起始位置sa[i],那么它最多能得到该后缀长度个子串(n-sa[i]个),而其中有height[i]个是与前一个后缀相同的,所以它能产生的实际后缀个数便是n-sa[i]-height[i]。遍历一次所有的后缀,将它产生的后缀数加起来便是答案。那么我们这道题是求包含x的最长不重复子串,那么很明显我们需要将x加入进去,因为所有子串都可以通过每个后缀的前缀来得到,因此我们需要找到每一个位置sa[i]的右边的最近的x的位置,这样我们就能通过一个计算式ans += (LL)n - max(f[sa[i]], sa[i]+height[i]);(其中f[sa[i]]表示每一个位置sa[i]的右边的最近的x的位置)得出答案了。

#include <cstdio>
#include <cstring>
#include <iostream>
#include <algorithm>
using namespace std;
typedef long long LL;
const int maxn = 1e5+5;

char s[maxn],x[2];
int sa[maxn], t[maxn], t2[maxn], c[maxn], f[maxn];
int Rank[maxn], height[maxn];

void build_sa(int n,int m){  //求sa数组
    int i,*x = t, *y = t2;
    for(i = 0; i < m; i++) c[i] = 0;
    for(i = 0; i < n; i++) c[x[i] = s[i]]++;
    for(i = 1; i < m; i++) c[i] += c[i-1];
    for(i = n-1; i >= 0; i--) sa[--c[x[i]]] = i;
    for(int k = 1; k <= n; k <<= 1){
        int p = 0;
        for(i = n-k; i < n; i++) y[p++] = i;
        for(i = 0; i < n; i++) if(sa[i] >= k) y[p++] = sa[i]-k;
        for(i = 0; i < m; i++) c[i] = 0;
        for(i = 0; i < n; i++) c[x[y[i]]]++;
        for(i = 0; i < m; i++) c[i] += c[i-1];
        for(i = n-1; i >= 0; i--) sa[--c[x[y[i]]]] = y[i];
        swap(x, y);
        p = 1,x[sa[0]] = 0;
        for(i = 1; i < n; i++)
            x[sa[i]] = y[sa[i-1]] == y[sa[i]] && y[sa[i-1]+k] == y[sa[i]+k]?p-1:p++;
        if(p >= n) break;
        m = p;
    }
}


void getHeight(int n){
    int i,j,k = 0;
    for(i = 0; i < n; i++) Rank[sa[i]] = i;
    for(i = 0; i < n-1; i++){
        if(k) k--;
        j = sa[Rank[i]-1];
        while(s[i+k] == s[j+k]) k++;
        height[Rank[i]] = k;
    }
}

int main(){
    int T;
    scanf("%d", &T);
    for(int kase = 1; kase <= T; kase++){
        memset(s, 0, sizeof(s));
        memset(x, 0, sizeof(x));
        scanf("%s%s", x, s);
        int n = strlen(s);
        build_sa(n+1, 255);
        getHeight(n+1);
        int cnt = n;
        for(int i = n-1; i >= 0; i--){ //向后找每一个位置最近的x的位置
            if(s[i] == x[0])
                cnt = i;
            f[i] = cnt;
        }
        LL ans = 0;  //注意为long long,有可能越界
        for(int i = 1; i <= n; i++)
            ans += (LL)n - max(f[sa[i]], sa[i]+height[i]);
        printf("Case #%d: %I64d\n", kase, ans);
    }
    return 0;
}

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值