bzoj3998 [TJOI2015]弦论

本文介绍了一种使用后缀自动机解决特定子串查找问题的方法,包括如何构建后缀自动机及针对不同情况调整节点计数的策略。适用于处理大规模字符串(长度可达5*10^5)中的第K小子串问题。

Description


对于一个给定长度为N的字符串,求它的第K小子串是什么。
T为0则表示不同位置的相同子串算作一个。T=1则表示不同位置的相同子串算作多个。K的意义如题所述。

N<=5*10^5
T<2
K<=10^9

Solution


涨姿势了
几周不打后缀自动机又不会打了,幸好还记得性质能推一推
T=0的时候每个点的right集看做是1,T=1的时候每个点的right集为子树中叶节点数目,这个递推一下就OK
剩下的就按照当前位字典序递增dfs一下就行

发现了一个惊人事实,这题并没有-1的点

Code


#include <stdio.h>
#include <string.h>

#define rep(i,st,ed) for (int i=st;i<=ed;++i)
#define drp(i,st,ed) for (int i=st;i>=ed;--i)
#define fill(x,t) memset(x,t,sizeof(x))
#define copy(x,t) memcpy(x,t,sizeof(x))

const int N=2000005;
const int L=500005;

int rec[N][26],len[N],fa[N];
int cnt[N],rank[N],size[N],val[N];
int tot=1,last=1;
char str[L];

void insert(int ch) {
    int p,q,np,nq;
    p=last; last=np=++tot;
    len[np]=len[p]+1; val[np]=1;
    while (p&&!rec[p][ch]) {
        rec[p][ch]=np;
        p=fa[p];
    }
    if (!p) fa[np]=1;
    else {
        q=rec[p][ch];
        if (len[q]-len[p]==1) {
            fa[np]=q;
        } else {
            nq=++tot; len[nq]=len[p]+1;
            copy(rec[nq],rec[q]);
            fa[nq]=fa[q];
            fa[q]=fa[np]=nq;
            while (p&&rec[p][ch]==q) {
                rec[p][ch]=nq;
                p=fa[p];
            }
        }
    }
}

void build(int opt) {
    rep(i,1,tot) cnt[len[i]]++;
    rep(i,1,tot) cnt[i]+=cnt[i-1];
    // drp(i,tot,1) rank[cnt[len[i]]--]=i; 这样打实际也是对的,这里只对基数排序后相同len的顺序产生影响
    rep(i,1,tot) rank[cnt[len[i]]--]=i;
    drp(ti,tot,1) {
        int now=rank[ti];
        if (opt==0) val[now]=1;
        else val[fa[now]]+=val[now];
    }
    val[1]=0;
    drp(ti,tot,1) {
        int now=rank[ti];
        size[now]=val[now];
        rep(i,0,25) {
            size[now]+=size[rec[now][i]];
        }
    }
}

void dfs(int now,int k) {
    if (k<=val[now]) return ;
    k-=val[now];
    rep(i,0,25) {
        if (rec[now][i]) {
            if (k<=size[rec[now][i]]) {
                putchar(i+'a');
                dfs(rec[now][i],k);
                return ;
            }
            k-=size[rec[now][i]];
        }
    }
}

int main(void) {
    freopen("data.in","r",stdin);
    freopen("myp.out","w",stdout);
    scanf("%s",str);
    int opt,k; scanf("%d%d",&opt,&k);
    int __=strlen(str);
    rep(i,0,__-1) {
        insert(str[i]-'a');
    }
    build(opt);
    dfs(1,k);
    return 0;
}
### NOIP2015 运输计划 BZOJ4326 题解分析 #### 问题背景 该问题是经典的图论优化问题之一,主要考察树结构上的路径操作以及高效的数据处理能力。题目要求在一个由 $n$ 个节点组成的无向连通树中找到最优的一条边将其改造为虫洞(通过此边不需要耗费时间),从而使得给定的 $m$ 条运输路径中的最长耗时最小化。 --- #### 解决方案概述 解决这一问题的核心在于利用 **二分答案** 和 **树上差分技术** 的组合来实现高效的计算过程。以下是具体的技术细节: 1. **二分答案**: 设当前目标是最小化的最大路径长度为 $T_{\text{max}}$。我们可以通过二分的方式逐步逼近最终的结果。每次尝试验证是否存在一种方式将某条边改为虫洞后使所有路径的最大值不超过当前设定的目标值 $mid$[^1]。 2. **路径标记与统计**: 使用树上差分的思想对每一条路径进行标记并快速统计受影响的情况。假设两点之间的最近公共祖先 (Lowest Common Ancestor, LCA) 是 $r = \text{lca}(u_i, v_i)$,则可以在三个位置分别施加影响:增加 $(u_i + 1), (v_i + 1)$ 同时减少 $(r - 2)$。这种操作能够有效覆盖整条路径的影响范围,并便于后续统一查询和判断[^1]。 3. **数据结构支持**: 结合线段树或者 BIT (Binary Indexed Tree),可以进一步加速区间修改和单点查询的操作效率。这些工具帮助我们在复杂度范围内完成大量路径的同时更新和检索需求[^2]。 4. **实际编码技巧**: 实现过程中需要注意一些边界条件和技术要点: - 正确维护 DFS 序列以便映射原树节点到连续编号序列; - 准备好辅助函数用于快速定位 LCA 节点及其对应关系; - 编码阶段应特别留意变量初始化顺序及循环终止逻辑以防潜在错误发生。 下面给出一段基于上述原理的具体 Python 实现代码作为参考: ```python from collections import defaultdict, deque class Solution: def __init__(self, n, edges): self.n = n self.graph = defaultdict(list) for u, v, w in edges: self.graph[u].append((v, w)) self.graph[v].append((u, w)) def preprocess(self): """Preprocess the tree to get dfs order and lca.""" pass def binary_search_answer(self, paths): low, high = 0, int(1e9) best_possible_time = high while low <= high: mid = (low + high) // 2 if self.check(mid, paths): # Check feasibility with current 'mid' best_possible_time = min(best_possible_time, mid) high = mid - 1 else: low = mid + 1 return best_possible_time def check(self, limit, paths): diff_array = [0]*(self.n+1) for path_start, path_end in paths: r = self.lca(path_start, path_end) # Apply difference on nodes based on their relationship. diff_array[path_start] += 1 diff_array[path_end] += 1 diff_array[r] -= 2 suffix_sum = [sum(diff_array[:i]) for i in range(len(diff_array)+1)] # Verify whether any edge can be modified within given constraints. possible_to_reduce_max = False for node in range(1, self.n+1): parent_node = self.parent[node] if suffix_sum[node]-suffix_sum[parent_node]>limit: continue elif not possible_to_reduce_max: possible_to_reduce_max=True return possible_to_reduce_max # Example usage of class methods would follow here... ``` --- #### 总结说明 综上所述,本题的关键突破点在于如何巧妙运用二分策略缩小搜索空间,再辅以恰当的树形结构遍历技术和差分手段提升整体性能表现。这种方法不仅适用于此类特定场景下的最优化求解任务,在更广泛的动态规划领域也有着广泛的应用前景[^3]。 ---
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值