初学回文自动机

最新推荐文章于 2025-11-06 01:59:12 发布

原创最新推荐文章于 2025-11-06 01:59:12 发布 · 置顶 · 2.4k 阅读

CC 4.0 BY-SA版权

回文这个东西，有一些不错的算法。比如马拉车算法，就是一种非常优秀的算法。
我也学过一篇有关马拉车的文章，非常的简单易懂。但我们今天讲的是比马拉车更强的算法——回文自动机。
回文自动机和AC自动机有一些类似的地方，所以有兴趣的同学可以看这篇文章来了解 AC自动机

好了，在开始今天的正文之前，我们得先定义一些数组，以便更好的了解回文自动机。

fail[x]：x失配后跳转到的不等于自身的最长后缀回文子串。（这个可能有点难看懂，但是参考AC自动机fail）

len[x]：以x为结尾的最长回文子串的长度。

cnt[x]：与以x结尾的最长回文子串相同的子串的个数

son[x][c]：编号为x的节点表示的回文串在两边添加字符c以后变成的回文串的编号

s[x]：第x次添加的字符（一开始设S[0] = -1，也可以是任意一个在串S中不会出现的字符）。

定义完这些数组后，我们就开始构建后缀自动机了。
首先我们建两个空节点0和1，其中 $fail[0]=1,len[1]=-1$ ,这样的设定对后面有用。
然后我们读入一个字符，找出以它为结尾的最长回文子串的长度。这段找的代码如下：

ll get_fail(ll p,ll x){
    while(s[x-len[p]-1]!=s[x]) p=fail[p];
    return p;
}

那么节点x的最长回文子串的长度为函数 $len[p]+2$ 。因为我们看某个回文子串的最左端是否和新加入的字符一样，如果一样那就是我们要求的回文子串，如果不一样，我们就跳转到当前回文串的最长后缀回文子串，继续匹配。是不是有点类似与AC自动机？
举个例子，比如当前串为cbbabb,那么最长的回文子串为bbabb，我们要加入字符a，那么a先与bbabb左边的字符(c)比较，发现不一样,于是跳转到bbabb的最长的后缀回文子串，也就是bb，继续匹配。发现bb左边的字符为a，和我们要加入的字符一样，所以新加入的len就是 $len(bb)+2=4$ ,也就是子串abba。
然后我们再求出它的fail，也就是当前串abba的最长后缀回文子串，那么我们拿bb继续和a匹配，很遗憾不能匹配，所以会一路跳转到0，而 $fail[0]=1$ ，所以到了点1，而 $len[1]=-1$ ，带到我们的 $get$ _ $fail$ 里发现是 $s[x-(-1)-1]=s[x]$ ，也就意味着 $s[x]=s[x]$ 所以它的最长后缀回文子串就是它自己b,所以我们把fail连到找到的点即可。fail[now]=son[get_fail(fail[cur],i)][s[i]-'a'];//cur=get_fail(last,i),s[i]是新加入的字符
建造的过程大家还可以自己举几个例子，再根据代码理解，应该比较容易理解。下面是代码：

#include<bits/stdc++.h>
#define MAXN 300010
#define ll long long
using namespace std;
ll read(){
    char c;ll x;while(c=getchar(),c<'0'||c>'9');x=c-'0';
    while(c=getchar(),c>='0'&&c<='9') x=x*10+c-'0';return x;
}
char s[MAXN];
ll fail[MAXN],son[MAXN][26],len[MAXN],cnt[MAXN];
ll tot,last,cur,ans;
ll newnode(ll x){
    len[tot]=x;
    return tot++;
}
ll get_fail(ll p,ll x){
    while(s[x-len[p]-1]!=s[x]) p=fail[p];
    return p;
}
int main()
{
    scanf("%s",s+1);
    s[0]=-1;fail[0]=1;last=0;
    newnode(0);newnode(-1);
    register int i;
    for(i=1;s[i];i++){
        cur=get_fail(last,i);
        if(!son[cur][s[i]-'a']){
            ll now=newnode(len[cur]+2);
            fail[now]=son[get_fail(fail[cur],i)][s[i]-'a'];
            son[cur][s[i]-'a']=now;
        } 
        cnt[last=son[cur][s[i]-'a']]++;
    }
    for(i=tot-1;i>=0;i--){
        cnt[fail[i]]+=cnt[i];
    }
    return 0;
}