最短不公共子串
题意:
问最短的满足:是A的子串(子序列),且不是B的子串(子序列,子序列(子串))。(共四个问题)
思路:
- 子串问题,考虑后缀自动机;子序列问题,考虑序列自动机;这不就成板子题了?
- 然后本题要求属于前者,而不属于后者的子结构,可以考虑暴力的在两种DAG上同时跑;若前者可以跑,后者却不能跑,说明此子结构仅属于前者,好像问题就解决了?
- 但仔细一想,长度为 2000 2000 2000的串子序列似乎太多了,好像不能跑完?这里我们考虑 b f s bfs bfs,记录哪些状态(二维)已经遍历;对于已经遍历过的状态,虽然此前在遍历时当前状态所代表的子结构可能不一样(比如序列自动机通过不同的路径到达某个节点),但此后节点的可到达性却只与当前节点是否可到达有关,而与怎样到达的无关,故后续节点是否可到达在之前的 b f s bfs bfs中已经处理好了;因此可以像普通的 b f s bfs bfs一样,遍历过的状态可接忽略掉!(使用 n × n n×n n×n的 v i s vis vis数组记录)
- 复杂度:后缀自动机为 O ( n ∗ ∑ ) O(n*∑) O(n∗∑);序列自动机为 O ( n ∗ ∑ ) O(n*∑) O(n∗∑);每个后缀自动机节点数为 2 ∗ n 2*n 2∗n,每个序列自动机节点数为 n n n, b f s bfs bfs遍历时每个点遍历边数为 ∑ ∑ ∑,因此 b f s bfs bfs复杂度为 O ( n ∗ ∑ ) O(n*∑) O(n

利用后缀自动机解决子串问题,序列自动机处理子序列问题,结合BFS遍历寻找最短不同时属于两个字符串的子串。在BFS过程中,通过vis数组记录已遍历状态,优化复杂度至O(n*∑)。代码实现中,四次BFS可统一处理。
最低0.47元/天 解锁文章
389

被折叠的 条评论
为什么被折叠?



