题目链接:点击进入
题目
题意
给你 26 个小写英文字母的各自价值,给你一个字符串,在所有不同的子串中,求第 k 小的子串权值。
思路
二分答案,用后缀数组来 check 二分值 mid 。
具体 check :
遍历后缀数组,对于后缀的所有前缀,它们的权值是递增的,可以再次二分求此后缀中权值小于等于 mid 的所有前缀数量 ( 这里可以用前缀和求前缀的权值 )。这里注意,因为会有重复的子串,也就是会重复将某些前缀计入答案,所以我们还要减去重复计算的部分。这里可以使用 height 数组,height 数组记录当前遍历的后缀与前一个遍历的后缀的最大公共前缀长度,这里我们判断 二分得到的前缀数量 与 height 数组的值 大小,减去两者中小的那个,小的代表重合的长度。
后缀数组 sa [ i ] 就表示排名为 i 的后缀的起始位置的下标
映射数组 rk [ i ] 就表示起始位置的下标为 i 的后缀的排名
定义以 s 的第 i 个字符为第一个元素的后缀为 suff ( i ) ;
定义 LCP ( i , j ) 为 suff ( sa [ i ] ) 与 suff ( sa [ j ] ) 的最长公共前缀
height [ i ] 为 LCP ( i , i - 1 ) ,1 < i <= n ( height [ 1 ] = 0 )
代码
//#pragma GCC optimize(3)//O3
//#pragma GCC optimize(2)//O2
#include<iostream>
#include<string>
#include<map>
#include<set>
//#include<unordered_map>
#include<queue>
#include<cstdio>
#include<vector>
#include<cstring>
#include<stack>
#include<algorithm>
#include<iomanip>
#include<cmath>
#include<fstream>
#define X first
#define Y second
#define best 131
#define INF 0x3f3f3f3f3f3f3f3f
#define pii pair<int,int>
#define lowbit(x) x & -x
#define inf 0x3f3f3f3f
//#define int long long
//#define double long double
//#define rep(i,x,y) for(register int i = x; i <= y;++i)
using namespace std;
typedef long long ll;
typedef unsigned long long ull;
const double pai=acos(-1.0);
const int maxn=2e5+10;
const int mod=998244353;
const double eps=1e-9;
const int N=5e3+10;
int y[maxn],x[maxn],c[maxn],sa[maxn],rk[maxn],height[maxn];
int n,m,t,val[210];
char s[maxn];
void get_sa()
{
for(int i=1;i<=n;++i) ++c[x[i]=s[i]];
for(int i=2;i<=m;++i) c[i]+=c[i-1];
for(int i=n;i>=1;--i) sa[c[x[i]]--]=i;
for(int k=1;k<=n;k<<=1)
{
int num=0;
for(int i=n-k+1;i<=n;++i) y[++num]=i;
for(int i=1;i<=n;++i) if(sa[i]>k) y[++num]=sa[i]-k;
for(int i=1 ;i<=m;++i) c[i]=0;
for(int i=1;i<=n;++i) ++c[x[i]];
for(int i=2;i<=m;++i) c[i]+=c[i-1];
for(int i=n;i>=1;--i) sa[c[x[y[i]]]--]=y[i],y[i]=0;
swap(x,y);x[sa[1]]=1;num=1;
for(int i=2;i<=n;++i)
x[sa[i]]=(y[sa[i]]==y[sa[i-1]]&&y[sa[i]+k]==y[sa[i-1]+k])?num:++num;
if(num==n) break;
m=num;
}
}
void get_height()
{
int k=0;
for(int i=1;i<=n;++i) rk[sa[i]]=i;
for(int i=1;i<=n;++i)
{
if(rk[i]==1) continue;
if(k) k--;
int j=sa[rk[i]-1];
while(j+k<=n&&i+k<=n&&s[i+k]==s[j+k]) k++;
height[rk[i]]=k;
}
}
void init()
{
memset(c,0,sizeof(c));
}
int sum[maxn];
bool judge(int mid,int midd,int l)
{
return sum[mid]-sum[l-1]<=midd;
}
ll k;
bool check(int miid)
{
ll res=0;
for(int i=1;i<=n;i++)
{
int l=sa[i],r=n,ans=-1;
while(l<=r)
{
int mid=l+r>>1;
if(judge(mid,miid,sa[i]))
l=mid+1,ans=mid;
else
r=mid-1;
}
if(ans!=-1)
{
res+=ans-sa[i]+1;
if(ans-sa[i]+1<height[i])
res-=ans-sa[i]+1;
else
res-=height[i];
}
}
return res>=k;
}
int main()
{
scanf("%d",&t);
while(t--)
{
init();
scanf("%d%lld",&n,&k);
scanf("%s",s+1);
for(int i=0;i<26;i++) scanf("%d",&val[i]);
int l=1,r=0,ans=-1;
for(int i=1;i<=n;i++) r+=val[s[i]-'a'];
for(int i=1;i<=n;i++) sum[i]=sum[i-1]+val[s[i]-'a'];
m=(int)('z');
get_sa();
get_height();
while(l<=r)
{
int mid=l+r>>1;
if(check(mid))
r=mid-1;
else
l=mid+1;
}
if(check(l))
printf("%d\n",l);
else
printf("-1\n");
}
return 0;
}