序列自动机(板子总结+例题)

最新推荐文章于 2022-09-24 19:31:45 发布

原创最新推荐文章于 2022-09-24 19:31:45 发布 · 862 阅读

2 ·

CC 4.0 BY-SA版权

文章标签：

#序列自动机 #字符串

知识点总结专栏收录该内容

90 篇文章

订阅专栏

博客围绕一个模式串和多个询问串展开，探讨询问串是否为模式串子序列的问题。通过构建序列自动机解决，介绍了自动机的构建思路、预处理和匹配复杂度，还分享了建自动机的心得，如优先出现字母先构建等。

题目

一个模式串s(|s|<=1e5)，

n(n<=1e5)个询问，每次询问一个串t(|t|<=1e3)

每次询问t是不是s的子序列

思路来源

https://blog.youkuaiyun.com/gemorz/article/details/53184721

题解

建一下序列自动机，然后每次在自动机上跑一下，

类似trie树，看看是否存在即可

预处理自动机O(26*|s|)，匹配O(n*t)

心得

算是学习了一下序列自动机

建子序列自动机的时候，优先出现的字母先构建

比如aaabab的ab串，就是由第一个a和第四个b建的

这样保证了不会错过后续来的字符串

此外，每次加入一个新字符时，考虑能给哪些子序列带来贡献

那么就是在以往所有的子序列后增加一个新字符即可，

只需枚举过往所有子序列的最后一个字符是什么，

而由于序列自动机的优先性，

任意一个子序列的最后一个字符x，肯定是最后一个被加入的字符x，

所以从‘a’到‘z'枚举，补到最后一个字符位置后面即可，

注意到这里许多子序列的儿子节点都是共用的一个节点，

所以这也使得若干子序列都是共用的，

补在这个节点后面就相当于补在所有以这个子节点为结尾节点的子序列后面

复杂度据说是O(n*a)，但我觉得好像是O(所有本质不同子序列的长度之和)

代码1

#include<iostream>
#include<cstdio>
#include<cstring>
using namespace std;
const int maxn=1e5+10;
int n,len,rt;
char s[maxn],t[maxn];
int par[maxn];
int head[26],last[26];
int ch[maxn][26];
void add(int x)
{
    par[++rt]=last[x];
    if(!last[x])head[x]=rt;
    for(int i=0;i<26;i++)
      for(int j=last[i];j&&!ch[j][x];j=par[j])
         ch[j][x]=rt;
//共用多个节点 在每个子序列的结尾后续一个 枚举上一个串的结尾的节点是哪个
//复杂度应该为 所有本质不同的子序列长度之和 毕竟是在每个后面续字符构成新序列和新的ch关系 
    last[x]=rt;
}
bool find(char s[])
{
	int rt,len=strlen(s);
	for(int i=0;i<len;++i)
	{
		int x=s[i]-'a';
		if(!i)rt=head[x];
		else rt=ch[rt][x];
		if(!rt)return 0;
	}
	return 1;
}
//模式串s n个串t 判断t是不是s的子序列 
int main()
{
	scanf("%s",s);
	len=strlen(s);
	for(int i=0;i<len;++i)
	{
		int x=s[i]-'a';
		add(x);
	}
	scanf("%d",&n);
	for(int i=0;i<n;++i)
	{
		scanf("%s",t);
		puts(find(t)?"YES":"NO");
	}
	return 0;
}