【TJOI2015】【BZOJ3998】弦论

本文介绍了一个算法问题:如何找到给定字符串中字典序第K小子串。通过构建后缀自动机(SAM),实现了高效查找。文章包含完整的C++代码实现,并附带调试经验分享。

Description

对于一个给定长度为N的字符串,求它的第K小子串是什么。

Input

第一行是一个仅由小写英文字母构成的字符串S

第二行为两个整数T和K,T为0则表示不同位置的相同子串算作一个。T=1则表示不同位置的相同子串算作多个。K的意义如题所述。
Output

输出仅一行,为一个数字串,为第K小的子串。如果子串数目不足K个,则输出-1

Sample Input

aabc

0 3
Sample Output

aab

HINT

N<=5*10^5

T<2

K<=10^9
Source
字典序第k小子串
SAM裸题
张天扬论文有详解
我这个傻逼求right集合的方法错了一直WA…
第二天才调好QAQ

#include<iostream>
#include<cstdio>
#include<cstring>
#include<cmath>
#include<algorithm>
#define MAXN 1000010
using namespace std;
int T,n,k;
char ch[MAXN>>1];
int c[MAXN],od[MAXN];
struct sam
{
    int p,q,np,nq,last,cnt;
    int len[MAXN],a[MAXN][26],fa[MAXN];
    int right[MAXN],sum[MAXN];
    sam()
    {
        last=++cnt;
    }
    inline void insert(int c)
    {
        p=last;np=last=++cnt;len[np]=len[p]+1;len[np]=len[p]+1;right[np]=1;
        while (!a[p][c]&&p) a[p][c]=np,p=fa[p];
        if (!p) fa[np]=1;
        else
        {
            q=a[p][c];
            if (len[q]==len[p]+1)   fa[np]=q;
            else
            {
                nq=++cnt;len[nq]=len[p]+1;
                memcpy(a[nq],a[q],sizeof(a[q]));
                fa[nq]=fa[q];fa[q]=fa[np]=nq;
                while (a[p][c]==q)  a[p][c]=nq,p=fa[p];
            }
        }
    }
    inline void init()//求出right集合和可到达状态总数sum 
    {
        for (int i=1;i<=cnt;i++)    c[len[i]]++;
        int L=strlen(ch);
        for (int i=1;i<=L;i++)  c[i]+=c[i-1];
        for (int i=cnt;i;i--)   od[c[len[i]]--]=i;
        for (int i=cnt;i;i--)
        {
            int x=od[i];
            if (T)  right[fa[x]]+=right[x];
            else    right[x]=1;
        }
        right[1]=0;
        for (int i=cnt;i;i--)
        {
            int x=od[i];
            sum[x]=right[x];
            for (int j=0;j<26;j++)  sum[x]+=sum[a[x][j]];
        }
    }
    inline void dfs(int x,int nowk)
    {
        if (nowk<=right[x]) return;
        nowk-=right[x];
        for (int i=0;i<26;i++)
            if (a[x][i])
            {
                if (nowk<=sum[a[x][i]])
                {
                    putchar(i+'a');
                    dfs(a[x][i],nowk);
                    return;
                }
                nowk-=sum[a[x][i]];
            }
    }
}sam;
int main()
{
    scanf("%s",ch);
    scanf("%d%d",&T,&k);
    int l=strlen(ch);
    for (int i=0;i<l;i++)   sam.insert(ch[i]-'a');
    sam.init();
    if (k>sam.sum[1])   puts("-1");
    else    sam.dfs(1,k);
}
### NOIP2015 运输计划 BZOJ4326 题解分析 #### 问题背景 该问题是经典的图论优化问题之一,主要考察树结构上的路径操作以及高效的数据处理能力。题目要求在一个由 $n$ 个节点组成的无向连通树中找到最优的一条边将其改造为虫洞(通过此边不需要耗费时间),从而使得给定的 $m$ 条运输路径中的最长耗时最小化。 --- #### 解决方案概述 解决这一问题的核心在于利用 **二分答案** 和 **树上差分技术** 的组合来实现高效的计算过程。以下是具体的技术细节: 1. **二分答案**: 设当前目标是最小化的最大路径长度为 $T_{\text{max}}$。我们可以通过二分的方式逐步逼近最终的结果。每次尝试验证是否存在一种方式将某条边改为虫洞后使所有路径的最大值不超过当前设定的目标值 $mid$[^1]。 2. **路径标记与统计**: 使用树上差分的思想对每一条路径进行标记并快速统计受影响的情况。假设两点之间的最近公共祖先 (Lowest Common Ancestor, LCA) 是 $r = \text{lca}(u_i, v_i)$,则可以在三个位置分别施加影响:增加 $(u_i + 1), (v_i + 1)$ 同时减少 $(r - 2)$。这种操作能够有效覆盖整条路径的影响范围,并便于后续统一查询和判断[^1]。 3. **数据结构支持**: 结合线段树或者 BIT (Binary Indexed Tree),可以进一步加速区间修改和单点查询的操作效率。这些工具帮助我们在复杂度范围内完成大量路径的同时更新和检索需求[^2]。 4. **实际编码技巧**: 实现过程中需要注意一些边界条件和技术要点: - 正确维护 DFS 序列以便映射原树节点到连续编号序列; - 准备好辅助函数用于快速定位 LCA 节点及其对应关系; - 编码阶段应特别留意变量初始化顺序及循环终止逻辑以防潜在错误发生。 下面给出一段基于上述原理的具体 Python 实现代码作为参考: ```python from collections import defaultdict, deque class Solution: def __init__(self, n, edges): self.n = n self.graph = defaultdict(list) for u, v, w in edges: self.graph[u].append((v, w)) self.graph[v].append((u, w)) def preprocess(self): """Preprocess the tree to get dfs order and lca.""" pass def binary_search_answer(self, paths): low, high = 0, int(1e9) best_possible_time = high while low <= high: mid = (low + high) // 2 if self.check(mid, paths): # Check feasibility with current 'mid' best_possible_time = min(best_possible_time, mid) high = mid - 1 else: low = mid + 1 return best_possible_time def check(self, limit, paths): diff_array = [0]*(self.n+1) for path_start, path_end in paths: r = self.lca(path_start, path_end) # Apply difference on nodes based on their relationship. diff_array[path_start] += 1 diff_array[path_end] += 1 diff_array[r] -= 2 suffix_sum = [sum(diff_array[:i]) for i in range(len(diff_array)+1)] # Verify whether any edge can be modified within given constraints. possible_to_reduce_max = False for node in range(1, self.n+1): parent_node = self.parent[node] if suffix_sum[node]-suffix_sum[parent_node]>limit: continue elif not possible_to_reduce_max: possible_to_reduce_max=True return possible_to_reduce_max # Example usage of class methods would follow here... ``` --- #### 总结说明 综上所述,本题的关键突破点在于如何巧妙运用二分策略缩小搜索空间,再辅以恰当的树形结构遍历技术和差分手段提升整体性能表现。这种方法不仅适用于此类特定场景下的最优化求解任务,在更广泛的动态规划领域也有着广泛的应用前景[^3]。 ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值