HDU - 6988 - Display Substring ( 二分 + 后缀数组 )

题目链接:点击进入
题目

在这里插入图片描述
在这里插入图片描述

题意

给你 26 个小写英文字母的各自价值,给你一个字符串,在所有不同的子串中,求第 k 小的子串权值。

思路

二分答案,用后缀数组来 check 二分值 mid 。
具体 check :
遍历后缀数组,对于后缀的所有前缀,它们的权值是递增的,可以再次二分求此后缀中权值小于等于 mid 的所有前缀数量 ( 这里可以用前缀和求前缀的权值 )。这里注意,因为会有重复的子串,也就是会重复将某些前缀计入答案,所以我们还要减去重复计算的部分。这里可以使用 height 数组,height 数组记录当前遍历的后缀与前一个遍历的后缀的最大公共前缀长度,这里我们判断 二分得到的前缀数量 与 height 数组的值 大小,减去两者中小的那个,小的代表重合的长度。
后缀数组 sa [ i ] 就表示排名为 i 的后缀的起始位置的下标
映射数组 rk [ i ] 就表示起始位置的下标为 i 的后缀的排名
定义以 s 的第 i 个字符为第一个元素的后缀为 suff ( i ) ;
定义 LCP ( i , j ) 为 suff ( sa [ i ] ) 与 suff ( sa [ j ] ) 的最长公共前缀
height [ i ] 为 LCP ( i , i - 1 ) ,1 < i <= n ( height [ 1 ] = 0 )

代码
//#pragma GCC optimize(3)//O3
//#pragma GCC optimize(2)//O2
#include<iostream>
#include<string>
#include<map>
#include<set>
//#include<unordered_map>
#include<queue>
#include<cstdio>
#include<vector>
#include<cstring>
#include<stack>
#include<algorithm>
#include<iomanip>
#include<cmath>
#include<fstream>
#define X first
#define Y second
#define best 131 
#define INF 0x3f3f3f3f3f3f3f3f
#define pii pair<int,int>
#define lowbit(x) x & -x
#define inf 0x3f3f3f3f
//#define int long long
//#define double long double
//#define rep(i,x,y) for(register int i = x; i <= y;++i)
using namespace std;
typedef long long ll;
typedef unsigned long long ull;
const double pai=acos(-1.0);
const int maxn=2e5+10;
const int mod=998244353;
const double eps=1e-9;
const int N=5e3+10;

int y[maxn],x[maxn],c[maxn],sa[maxn],rk[maxn],height[maxn];
int n,m,t,val[210];
char s[maxn];
void get_sa() 
{
    for(int i=1;i<=n;++i) ++c[x[i]=s[i]];
    for(int i=2;i<=m;++i) c[i]+=c[i-1];
    for(int i=n;i>=1;--i) sa[c[x[i]]--]=i;
    for(int k=1;k<=n;k<<=1) 
    {
        int num=0;
        for(int i=n-k+1;i<=n;++i) y[++num]=i;
        for(int i=1;i<=n;++i) if(sa[i]>k) y[++num]=sa[i]-k;
        for(int i=1 ;i<=m;++i) c[i]=0;
        for(int i=1;i<=n;++i) ++c[x[i]];
        for(int i=2;i<=m;++i) c[i]+=c[i-1]; 
        for(int i=n;i>=1;--i) sa[c[x[y[i]]]--]=y[i],y[i]=0;
        swap(x,y);x[sa[1]]=1;num=1;
        for(int i=2;i<=n;++i)
            x[sa[i]]=(y[sa[i]]==y[sa[i-1]]&&y[sa[i]+k]==y[sa[i-1]+k])?num:++num;
        if(num==n) break;
        m=num;
    }
}
void get_height() 
{
    int k=0;
    for(int i=1;i<=n;++i) rk[sa[i]]=i;
    for(int i=1;i<=n;++i) 
    {
        if(rk[i]==1) continue;
        if(k) k--;
        int j=sa[rk[i]-1];
        while(j+k<=n&&i+k<=n&&s[i+k]==s[j+k]) k++;
        height[rk[i]]=k;
    }
}

void init()
{
    memset(c,0,sizeof(c));
}

int sum[maxn];

bool judge(int mid,int midd,int l)
{
    return sum[mid]-sum[l-1]<=midd;
}

ll k;

bool check(int miid)
{
    ll res=0;
    for(int i=1;i<=n;i++)
    {
        int l=sa[i],r=n,ans=-1;
        while(l<=r)
        {
            int mid=l+r>>1;
            if(judge(mid,miid,sa[i]))
                l=mid+1,ans=mid;
            else 
                r=mid-1;
        }
        if(ans!=-1)
        {
            res+=ans-sa[i]+1;
            if(ans-sa[i]+1<height[i])
                res-=ans-sa[i]+1;
            else 
                res-=height[i];
        }
    }
    return res>=k;
}

int main() 
{
    scanf("%d",&t);
    while(t--)
    {
        init(); 
        scanf("%d%lld",&n,&k);
        scanf("%s",s+1);
        for(int i=0;i<26;i++) scanf("%d",&val[i]);
        int l=1,r=0,ans=-1;
        for(int i=1;i<=n;i++) r+=val[s[i]-'a'];
        for(int i=1;i<=n;i++) sum[i]=sum[i-1]+val[s[i]-'a'];
        m=(int)('z');
        get_sa(); 
        get_height();
        while(l<=r)
        {
            int mid=l+r>>1;
            if(check(mid))
                r=mid-1;
            else 
                l=mid+1;
        }
        if(check(l))
            printf("%d\n",l);
        else 
            printf("-1\n");
    }
    return 0;
}
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值