ST03Day5 后缀自动机

本文深入探讨了后缀自动机(SAM)的基本原理及其在字符串处理中的应用,包括基数排序更新、后缀树与后缀数组的关系,以及如何通过后缀自动机解决最长公共子串等问题。同时,介绍了子序列自动机的构造方法和实例。

Further Reading

陈立杰《后缀自动机》WC2012

http://hihocoder.com/contest/hiho127

https://oi-wiki.org/string/sam/

https://cp-algorithms.com/string/suffix-automaton.html

正题

      原本我是会后缀自动机的太久没写所以忘得差不多了,事实证明板子要周周复习。

      SAM大致原理我就不多说了,相关的基本性质在其他讲SAM的Blog都可以看到。

      我们一般要对fail树从下往上更新并询问,那么这个时候我们可以用到基数排序。

      后缀树就是反串建后缀自动机的fail树,证明考虑在一个后缀自动机上,fail树上的一条链每个节点所选出的代表的串(也就是最长的串)是从短到长的,而且可以发现是不断地加一段前缀,然后有新贡献rig的节点就是我们后缀树上的叶子节点,当然这个可以用加特殊字符来解决贡献rig的节点不是fail树上的叶子节点,那么相当于在后缀树上加一段后缀,所以直接对反串建后缀自动机即可。

      但是后缀树没用,这是实话,明显可以发现后缀数组就相当于后缀树上叶子的dfs序,相邻两个的height就是相邻两个节点的lcp。

      后缀自动机更适用于比较general的问题,而后缀数组在解决和字典序有关的问题时特别好用。

      一些简单的例题就不再多说,一个性质就是一个节点新贡献的right的数目最多是1,然后right集合的大小是fail树上的子树和,这个很好理解,于是对于n个串的最长子串什么的,就可以用类似线段树合并来直接做。

      一道例题:

      看似很难?直接拓扑排序后对a进行dp,因为后缀自动机上能够表示所有的字串,所以沿着a往下走,直到走不动为止,然后跳到b的根继续尝试,直到在b的后缀自动机上也走不动为止。

       然后就是子序列自动机,简单易懂,直接维护下一个字符跳到哪里连边就可以。

       一道例题。

      

      直接用f[i][j]表示在第一个自动机上走到第i个节点,j同理时的最小长度。

      然后转移直到b走不动为止,就更新答案。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值