2016 Multi-University Training Contest 4 1006 Substring

题目链接:点击打开链接

题目大意:给你一个字符和一个字符串,问有多少个含有这个字符的不相同的子串。

解题思路:主题思路后缀数组,这是我第一次做后缀数组的题目,现场学真的有点累,sa表示的后缀排序第i位的开头的位置,height表示sa[i]和sa[i-1]的公共前缀长度,n-sa-height表示不重复的数量,但是到这里为止其实和字符的关系不大,所以加上一个修正的值,下个字符到结尾的长度,这部分是保证了子串中有要求字符存在。本质还算是一个模版题。

代码:

#include <iostream>
#include <string.h>
#include <algorithm>
#include <stdio.h>
using namespace std;
const int MAXN = 100001;

/*
*suffix array
*倍增算法  O(n*logn)
*待排序数组长度为n,放在0~n-1中,在最后面补一个0
*build_sa( ,n+1, );//注意是n+1;
*getHeight(,n);
*例如:
*n   = 8;
*num[]   = { 1, 1, 2, 1, 1, 1, 1, 2, $ };注意num最后一位为0,其他大于0
*rank1[]  = { 4, 6, 8, 1, 2, 3, 5, 7, 0 };rank1[0~n-1]为有效值,rank1[n]必定为0无效值
*sa[]    = { 8, 3, 4, 5, 0, 6, 1, 7, 2 };sa[1~n]为有效值,sa[0]必定为n是无效值
*height[]= { 0, 0, 3, 2, 3, 1, 2, 0, 1 };height[2~n]为有效值
*
*/

int sa[MAXN];//SA数组,表示将S的n个后缀从小到大排序后把排好序的
             //的后缀的开头位置顺次放入SA中
int t1[MAXN], t2[MAXN], c[MAXN];//求SA数组需要的中间变量,不需要赋值
int rank1[MAXN], height[MAXN];
//待排序的字符串放在s数组中,从s[0]到s[n-1],长度为n,且最大值小于m,
//除s[n-1]外的所有s[i]都大于0,r[n-1]=0
//函数结束以后结果放在sa数组中
void build_sa(int s[], int n, int m)
{
    int i, j, p, *x = t1, *y = t2;
    //第一轮基数排序,如果s的最大值很大,可改为快速排序
    for (i = 0;i<m;i++)c[i] = 0;
    for (i = 0;i<n;i++)c[x[i] = s[i]]++;
    for (i = 1;i<m;i++)c[i] += c[i - 1];
    for (i = n - 1;i >= 0;i--)sa[--c[x[i]]] = i;
    for (j = 1;j <= n;j <<= 1)
    {
        p = 0;
        //直接利用sa数组排序第二关键字
        for (i = n - j;i<n;i++)y[p++] = i;//后面的j个数第二关键字为空的最小
        for (i = 0;i<n;i++)if (sa[i] >= j)y[p++] = sa[i] - j;
        //这样数组y保存的就是按照第二关键字排序的结果
        //基数排序第一关键字
        for (i = 0;i<m;i++)c[i] = 0;
        for (i = 0;i<n;i++)c[x[y[i]]]++;
        for (i = 1;i<m;i++)c[i] += c[i - 1];
        for (i = n - 1;i >= 0;i--)sa[--c[x[y[i]]]] = y[i];
        //根据sa和x数组计算新的x数组
        swap(x, y);
        p = 1;x[sa[0]] = 0;
        for (i = 1;i<n;i++)
            x[sa[i]] = y[sa[i - 1]] == y[sa[i]] && y[sa[i - 1] + j] == y[sa[i] + j] ? p - 1 : p++;
        if (p >= n)break;
        m = p;//下次基数排序的最大值
    }
}
void getHeight(int s[], int n)
{
    int i, j, k = 0;
    for (i = 0;i <= n;i++)rank1[sa[i]] = i;
    for (i = 0;i<n;i++)
    {
        if (k)k--;
        j = sa[rank1[i] - 1];
        while (s[i + k] == s[j + k])k++;
        height[rank1[i]] = k;
    }
}

char str[MAXN];
int s[MAXN];
int xiuzheng[MAXN];
char ch;
int main()
{
    //freopen("in.txt","r",stdin);
    //freopen("out.txt","w",stdout);
    int T, cas = 0;
    scanf("%d", &T);
    while (T--)
    {
        scanf(" %c %s", &ch, str);
        int n = strlen(str);
        for (int i = 0;i <= n;i++)s[i] = str[i];
        build_sa(s, n + 1, 128);
        getHeight(s, n);
        int now = n;
        for (int i = n - 1;i >= 0;i--)
        {
            if (str[i] == ch)
                now = i;
            xiuzheng[i] = now;
        }
        long long ans = 0;
        for (int i = 1;i <= n;i++)
        {
            int add1 = n - sa[i] - height[i];
            int add2 = n - xiuzheng[sa[i]];
            ans += min(add1, add2);
        }
        printf("Case #%d: %lld\n", ++cas, ans);
    }
    return 0;
}



后缀数组模版:

#include <iostream>
#include <string.h>
#include <algorithm>
#include <stdio.h>
using namespace std;
const int MAXN = 100001;
char str[MAXN];
/*
*suffix array
*倍增算法  O(n*logn)
*待排序数组长度为n,放在0~n-1中,在最后面补一个0
*build_sa( ,n+1, );//注意是n+1;
*getHeight(,n);
*例如:
*n   = 8;
*num[]   = { 1, 1, 2, 1, 1, 1, 1, 2, $ };注意num最后一位为0,其他大于0
*rank1[]  = { 4, 6, 8, 1, 2, 3, 5, 7, 0 };rank1[0~n-1]为有效值,rank1[n]必定为0无效值
*sa[]    = { 8, 3, 4, 5, 0, 6, 1, 7, 2 };sa[1~n]为有效值,sa[0]必定为n是无效值
*height[]= { 0, 0, 3, 2, 3, 1, 2, 0, 1 };height[2~n]为有效值
*
*/
struct Suffix_Array
{
	int sa[MAXN];//SA数组,表示将S的n个后缀从小到大排序后把排好序的
				 //的后缀的开头位置顺次放入SA中
	int t1[MAXN], t2[MAXN], c[MAXN];//求SA数组需要的中间变量,不需要赋值
	int rank1[MAXN], height[MAXN];
	//待排序的字符串放在s数组中,从s[0]到s[n-1],长度为n,且最大值小于m,
	//除s[n-1]外的所有s[i]都大于0,r[n-1]=0
	//函数结束以后结果放在sa数组中
	int s[MAXN];
	void build_s(char str[],int n)
	{
		for (int i = 0;i <= n;i++)s[i] = str[i];
	}
	void build_sa(int s[], int n, int m)//计算sa
	{
		int i, j, p, *x = t1, *y = t2;
		//第一轮基数排序,如果s的最大值很大,可改为快速排序
		for (i = 0;i<m;i++)c[i] = 0;
		for (i = 0;i<n;i++)c[x[i] = s[i]]++;
		for (i = 1;i<m;i++)c[i] += c[i - 1];
		for (i = n - 1;i >= 0;i--)sa[--c[x[i]]] = i;
		for (j = 1;j <= n;j <<= 1)
		{
			p = 0;
			//直接利用sa数组排序第二关键字
			for (i = n - j;i<n;i++)y[p++] = i;//后面的j个数第二关键字为空的最小
			for (i = 0;i<n;i++)if (sa[i] >= j)y[p++] = sa[i] - j;
			//这样数组y保存的就是按照第二关键字排序的结果
			//基数排序第一关键字
			for (i = 0;i<m;i++)c[i] = 0;
			for (i = 0;i<n;i++)c[x[y[i]]]++;
			for (i = 1;i<m;i++)c[i] += c[i - 1];
			for (i = n - 1;i >= 0;i--)sa[--c[x[y[i]]]] = y[i];
			//根据sa和x数组计算新的x数组
			swap(x, y);
			p = 1;x[sa[0]] = 0;
			for (i = 1;i<n;i++)
				x[sa[i]] = y[sa[i - 1]] == y[sa[i]] && y[sa[i - 1] + j] == y[sa[i] + j] ? p - 1 : p++;
			if (p >= n)break;
			m = p;//下次基数排序的最大值
		}
	}
	void getHeight(int s[], int n)//计算height
	{
		int i, j, k = 0;
		for (i = 0;i <= n;i++)rank1[sa[i]] = i;
		for (i = 0;i<n;i++)
		{
			if (k)k--;
			j = sa[rank1[i] - 1];
			while (s[i + k] == s[j + k])k++;
			height[rank1[i]] = k;
		}
	}
}suffix_array;

int main()
{
	int T;
	scanf("%d", &T);
	while (T--)
	{
		scanf(" %s", str);
		int n = strlen(str);
		suffix_array.build_s(str, n);
		suffix_array.build_sa(suffix_array.s, n + 1, 128);
		suffix_array.getHeight(suffix_array.s, n);
	}
	return 0;
}


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值