spoj 694 不相同的子串的个数

本文介绍如何使用后缀数组解决字符串问题,通过计算不同后缀间的公共前缀长度来确定一个字符串中不同子串的数量。文章提供了一段C++代码实现,详细展示了后缀数组的构建过程及高度数组的计算方法。

转自:《后缀数组---处理字符串的有力工具》

题目大意:要求求一个字符串中不同子串的个数

解题思路:利用后缀数组,每个子串一定是某个后缀子串的前缀,求多少个不同的子串等价于求出所有后缀之间的不相同的前缀的个数。

设字符串为str,sa[i]表示排名第i的后缀从str的第sa[i]个位置开始,rank[i]表示str[i]开始的后缀排第几位

height[i]表示sa[i]和sa[i-1]的公共前缀为多少。

按照suffix(sa[1]), suffix(sa[2]),....suffix(sa[n])的顺序计算,每加入一个suffix(sa[i]),就产生n - sa[i] + 1个新前缀。其中height[i]个是和前面的后缀子串的前缀是相同的

所以suffix(sa[i])将贡献n-sa[i]+1-height[i]个不同的子串

#include <iostream>
#include <cstdio>
#include <cstring>

using namespace std;

const int maxn = 1010;

char str[maxn];
int wx[maxn], wy[maxn], c[maxn], height[maxn], sa[maxn], rank[maxn];

inline bool cmp(int *s, int a, int b, int l);
void suffix(char *s, int n, int m);
void cal_height(char *s, int *sa, int n);

int main()
{
    
    int n;
    scanf("%d", &n);
    while(n-- != 0)
    {
        scanf("%s", str);
        int len = strlen(str);
        str[len] = 0;
        suffix(str, len + 1, 26);
        cal_height(str, sa, len);
        int sum = 0;
        for(int i = 2; i <= len; i++)
            sum += len + 1 - sa[i] + 1 - height[i];
        printf("%d\n", sum);
    }
   
    return 0;
}

inline bool cmp(int *s, int a, int b, int l)
{
    return s[a] == s[b] && s[a + l] == s[b + l];
}

void suffix(char *s, int n, int m)
{
    int *x = wx, *y = wy, *t, index;
    for(int i = 0; i < m; i++)
        c[i] = 0;
    for(int i = 0; i < n; i++)
        c[x[i] = s[i]]++;
    for(int i = 1; i < m; i++)
        c[i] += c[i-1];
    for(int i = n - 1; i >= 0; i--)
        sa[--c[s[i]]] = i;
        
    for(int j = 1; j < n; j *= 2, m = index)
    {
        index = 0;
        for(int i = n - j; i < n; i++)
            y[index++] = i;
        for(int i = 0; i < n; i++)
        {
            if(sa[i] >= j)
                y[index++] = sa[i] - j;
        }
        
        for(int i = 0; i < m; i++)
            c[i] = 0;
        for(int i = 0; i < n; i++)
            c[x[y[i]]]++;
        for(int i = 1; i < m; i++)
            c[i] += c[i-1];
        for(int i = n - 1; i >= 0; i--)
            sa[--c[x[y[i]]]] = y[i];
        t = x; x = y; y = t;
        x[sa[0]] = rank[sa[0]] = 0;
        index = 1;
        for(int i = 1; i < n; i++)
        {
            if(j * 2 < n)
                x[sa[i]] = cmp(y, sa[i-1], sa[i], j) ? index - 1 : index++;
            else
                rank[sa[i]] = cmp(y, sa[i-1], sa[i], j) ? index - 1 : index++;
        }
    }
}

void cal_height(char *s, int *sa, int n)
{
    int k = 0;
    for(int i = 0; i < n; height[rank[i]] = k)
    {
        if(k != 0)
            k--;
        for(int j = sa[rank[i] - 1]; s[i + k] == s[j + k]; k++);
    }
}


 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值