CodeForces 128B String 后缀数组 或 优先队列维护 求第K小子串

题目大意:

给出一个长度不超过10^5的字符串求其所有子串当中字典序排行第K(K <= 10^5)的那个

此题对于多个子串相同的视为不同子串,即起点不同也视为不同


大致思路:

刚开始想的是后缀数组的解法, 首先对于这个字符串求后缀数组之后, 利用得到的sa数组的字典序, 因为这里的相同子串要多次计数, 所以对于后缀sa[i]和其他串的LCP也要多次计

于是计数稍微有点麻烦, 需要对每次连续的公共前缀多次计数, 细节见代码

另外是学长做的优先队列的写法:

首先建立优先队列, 其中的元素有两个关键字,分别是当前子串和其后续位置

按照子串的字典序排列之后, 每次抛出一个元素就是字典序最小的, 然后抛出的元素的串加上后续位置后插入优先队列, 继续抛出

第K个出队列的元素的第一关键字即为第K小子串


后缀数组解法:

Result  :  Accepted     Memory  :  3600 KB     Time  :  62 ms

/*
 * Author: Gatevin
 * Created Time:  2015/2/14 19:36:27
 * File Name: Mononobe_Mitsuki.cpp
 */
#include<iostream>
#include<sstream>
#include<fstream>
#include<vector>
#include<list>
#include<deque>
#include<queue>
#include<stack>
#include<map>
#include<set>
#include<bitset>
#include<algorith
### Codeforces Edu 后缀数组教程概述 后缀数组是一种用于字符处理的强大工具,它能够高效地解决许多涉及子串匹配、模式查找等问题。以下是基于已知引用内容以及专业知识对Codeforces Edu中的后缀数组相关内容的解析。 #### 什么是后缀数组后缀数组是一个一维数组,存储了一个字符的所有后缀按字典序排列后的起始位置索引。通过构建后缀数组,可以快速实现诸如最长公共前缀(LCP)、子串查询等功能[^1]。 #### 构建后uffix Array 的方法 一种常见的构建方式是倍增算法 (Doubling Algorithm),其核心思想是以长度逐步加倍的方式比较字符后缀。具体过程如下: - 初始化每个字符作为独立的一级排名; - 基于当前等级计算下一等级的排名,直到所有后缀都能被唯一区分为止。 下面是使用 C++ 实现的一个简单例子: ```cpp #include <bits/stdc++.h> using namespace std; const int MAXN = 1e5 + 7; int sa[MAXN], rank_arr[MAXN], tmp_rank[MAXN]; bool cmp_sa(int *rank, int i, int j, int k){ if(rank[i]!=rank[j])return rank[i]<rank[j]; int ri=(i+k<=strlen(s))?rank[i+k]:-1; int rj=(j+k<=strlen(s))?rank[j+k]:-1; return ri<rj; } void build_suffix_array(string &s,int n){ for(int i=0;i<n;i++)sa[i]=i,rank_arr[i]=s[i]-'a'; for(int k=1;k<n;k<<=1){ sort(sa,sa+n,[&](const int &a,const int &b)->bool{ return cmp_sa(rank_arr,a,b,k); }); tmp_rank[sa[0]]=0; for(int i=1;i<n;i++) tmp_rank[sa[i]] = tmp_rank[sa[i-1]]+(cmp_sa(rank_arr,sa[i-1],sa[i],k)?1:0); for(int i=0;i<n;i++)rank_arr[i]=tmp_rank[i]; if(tmp_rank[sa[n-1]]==n-1)break; } } // Example usage: string s="banana"; build_suffix_array(s,s.length()); ``` 此代码片段展示了如何利用倍增策略来创建一个基本的 suffix array 结构[^2]。 #### LCP 数组及其应用 为了进一步提升效率,在实际问题解过程中通常还需要配合 Longest Common Prefix (LPC) 数组一起工作。Kasai’s algorithm 是一种线性时间内构造 LCP 数组的有效方法之一。 下面展示的是 Kasai 算法的具体实现: ```cpp vector<int> kasai(const string &str, const vector<int> &suffixArray){ int n=str.size(); // Compute inverse of suffix array vector<int> invSuff(n,0); for(int i=0;i<n;i++)invSuff[suffixArray[i]]=i; int lcp=0; vector<int>lcpArr(n,0); for(int i=0;i<n;i++){ if(invSuff[i]==(n-1)){ lcp=0; continue; } int j=suffixArray[invSuff[i]+1]; while(i+lcp<n && j+lcp<n && str[i+lcp]==str[j+lcp]){ ++lcp; } lcpArr[invSuff[i]]=lcp; if(lcp>0)--lcp; } return lcpArr; } ``` 上述函数接受原始字符 `str` 和已经生成好的 Suffix Array (`suffixArray`) ,返回对应位置上的最大公共前缀值列表[^3]。 #### §相关问题§ 1. 如何优化现有的后缀数组构建算法使其适用于更大数据集? 2. 在哪些场景下适合采用后缀自动机而不是传统的后缀数组技术解决问题 ? 3. 是否可以通过 STL 中某些特定容器简化自定义数据结构的设计 ? 如果可能的话 , 提供相应实例说明 . 4. 探讨一下当面对多模式匹配任务时 , 使用 Aho-Corasick 自动机相比单纯依赖后缀数组的优势在哪里 。 5. 解释为什么有时候我们需要预处理额外的信息比如 height 数组者 RMQ 来加速区间询问操作?
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值