spoj 220 每个字符串至少出现两次且不重叠的最长子串 (后缀数组)

本文介绍了一种用于寻找每个字符串中至少出现两次且不重叠的最长子串的算法。通过连接多个字符串并使用特殊字符进行分隔,文章详细阐述了如何构建后缀数组并运用二分查找来确定最长子串的长度。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

题目:http://acm.hust.edu.cn/vjudge/problem/19293
题意:

给定 n 个字符串,求在每个字符串中至少出现两次且不重叠的最长子串。

分析:

做法和上题大同小异,也是先将 n 个字符串连起来,中间用不相同的且没有出现在字符串中的字符隔开,求后缀数组。然后二分答案,再将后缀分组。判断的时候,要看是否有一组后缀在每个原来的字符串中至少出现两次,并且在每个原来的字符串中,后缀的起始位置的最大值与最小值之差是否不小于当前答案(判断能否做到不重叠,如果题目中没有不重叠的要求,那么不用做此判断)。这个做法的时间复杂度为 O(nlogn)

#include<cstdio>
#include<cstring>
#include<algorithm>
#include<iostream>
using namespace std;
typedef long long ll;
const int INF = 1e9 + 9;
const int N = 2e5 + 9;

/********************倍增算法*后缀数组模板*******************************/

int sa[N], t1[N], t2[N], c[N], rk[N], height[N];
void build_sa (int s[], int n, int m) {
    int i, k, p, *x = t1, *y = t2;
    for (i = 0; i < m; i++) c[i] = 0;
    for (i = 0; i < n; i++) c[x[i] = s[i]]++;
    for (i = 1; i < m; i++) c[i] += c[i - 1];
    for (i = n - 1; i >= 0; i--) sa[--c[x[i]]] = i;
    for (k = 1; k <= n; k <<= 1) {
        p = 0;
        for (i = n - k; i < n; i++) y[p++] = i;
        for (i = 0; i < n; i++) if (sa[i] >= k) y[p++] = sa[i] - k;
        for (i = 0; i < m; i++) c[i] = 0;
        for (i = 0; i < n; i++) c[x[y[i]]]++;
        for (i = 1; i < m; i++) c[i] += c[i - 1];
        for (i = n - 1; i >= 0; i--) sa[--c[x[y[i]]]] = y[i];
        swap (x, y);
        p = 1;
        x[sa[0]] = 0;
        for (i = 1; i < n; i++)
            x[sa[i]] = y[sa[i - 1]] == y[sa[i]] && y[sa[i - 1] + k] == y[sa[i] + k] ? p - 1 : p ++;
        if (p >= n) break;
        m = p;
    }
}
void getHeight (int s[], int n) {
    int i, j, k = 0;
    for (i = 0; i <= n; i++) rk[sa[i]] = i;
    for (i = 0; i < n; i++) {
        if (k) k--;
        j = sa[rk[i] - 1];
        while (s[i + k] == s[j + k]) k++;
        height[rk[i]] = k;
    }
}
/********************************************************************************/


int s[N], n, m;
int Min[11], Max[11], length[11];//分别保存每个字符串的最小的前缀编号,最大的前缀编号,在总的后缀数组中的范围
char str[N];
int check (int x) { //判断在哪个字符串中
    for (int i = 0; i < m; i++)
        if (x < length[i]) return i;
}
bool judge (int k) {
    for (int i = 0; i < m; i++)
        if (Max[i] - Min[i] < k) return 0;
    return 1;
}
bool ok (int k) {

    memset (Min, 0x3f, sizeof (Min) );
    memset (Max, 0, sizeof (Max) );
    for (int i = 1; i <= n; i++) {
        if (height[i] < k) {
            if (judge (k) ) return 1; //判断上一段分组中是否每个字符串至少出现两次且不重叠的最长子串
            memset (Min, 0x3f, sizeof (Min) );
            memset (Max, 0, sizeof (Max) );
            int id = check (sa[i]);
            Min[id] = Max[id] = sa[i];
            continue;
        }
        int id = check (sa[i]);
        if (Max[id] < sa[i]) Max[id] = sa[i];
        if (Min[id] > sa[i]) Min[id] = sa[i];
    }
    return judge (k);
}
int main() {
    //freopen ("f.txt", "r", stdin);
    int T;
    scanf ("%d", &T);
    while (T--) {
        scanf ("%d", &m);
        int XX = 30;
        n = 0;
        for (int i = 0; i < m; i++) {
            scanf ("%s", str);
            int len = strlen (str);
            for (int j = 0; j < len; j++) s[n++] = str[j] - 'a' + 1;
            s[n++] = XX++; //每个字符串后面插入一个不同的符号
            length[i] = n;
        }
        s[n] = 0;
        build_sa (s, n + 1, 150);
        getHeight (s, n);

        int l = 0, r = n;
        while (l < r) { //二分长度
            int mid = l + (r - l + 1) / 2;
            if (ok (mid) ) l = mid;
            else r = mid - 1;
        }
        printf ("%d\n", l);
    }
    return 0;
}
/*
Input:
1
4
abbabba
dabddkababa
bacaba
baba

Output:
2

*/
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值