字符串系列(六)——回文自动机

本文介绍了2014年发明的回文自动机算法,详细解释了节点、数组定义及如何构建回文树。通过实例代码展示了算法的具体实现过程。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

想不到吧我还在更新哈哈哈哈哈。
这里写图片描述
今天带来一个2014年发明的算法——回文自动机。
既然写了这篇博客,那我就说得全面一些。

回文自动机

这个算法也称回文树。
可以类比一些其他的自动机,回文自动机也是有许多节点、许多next、许多fail的。

1、节点的那些事

每个节点都表示一个回文子串(注意了啊,只表示一个,SAM才是一类),且任意两个节点所表示的串必定不全等。(可以用数归证明,一个长度为n的串,其本质不同的回文子串数在O(n)级别)

2、数组定义

next[i][c]next[i][c]表示在i节点所代表的串的两端各添加一个字符c,得到的那个新回文子串所在的节点。
fail[i]fail[i]表示i节点的串的最长回文后缀。
cnt[i]cnt[i]表示这个串共出现了几次。
len[i]len[i]表示节点i这个串的长度。
num[i]num[i]表示这个串有多少回文后缀。

int nxt[N][26]; //i节点对应的回文串在两边各加一个字符后变成的节点编号
int fail[N]; //fail[i]表示的串是i的最长后缀回文串
int cnt[N]; //表示这个串出现过几次 
int num[N]; //节点i这个串的后缀有多少是回文的
int len[N]; //节点i表示的回文串的长度
int S[N]; //S[i]是第i次添加的字符
int last; //以n结束的最长回文串所在的节点
int n; //目前添加的字符个数
int p; //下一个新建节点的标号
3、回文串长度奇偶处理

在初始时,0节点赋0的长度,1节点赋-1的长度。last指向0,0的fail指向1。同时Str[0] = -1。

具体原因不讲。

inline int newnode(int l) {
    //新建节点
    for(int i = 0; i < 26; ++i) nxt[p][i] = 0;
    cnt[p] = num[p] = 0;
    len[p] = l;
    return p++;
}
inline void init() {
    p = 0;
    newnode(0);
    newnode(-1);
    last = n = 0;
    S[n] = -1;
    fail[0] = 1;
}
4、判断合法

新加进来一个字符时,只有Str[Nnowlen[x]1]=Str[Nnow]Str[Nnow−len[x]−1]=Str[Nnow] 我们才可以说是能构成一个新的回文串(构成回文节点唯一方法,就是在已有基础上找一个节点,在其两端各拓展一个字符,也就是我们所说的找到一个x,使式子成立)。
于是我们就可以去不停给last跑fail,直到满足条件。

inline int get_fail(int x) {
    while(S[n - len[x] - 1] != S[n]) x = fail[x];
    return x;
}
5、加一个字符进来
inline void add(int c) {
    S[++n] = c;
    int cur = get_fail(last); //通过上一个回文串找这个串的匹配位置
    if(!nxt[cur][c]) {
        //这个回文串从未出现过
        int now = newnode(len[cur] + 2);
        fail[now] = nxt[get_fail(fail[cur])][c]; //和AC自动机简直不要太类似
        nxt[cur][c] = now;
        num[now] = num[fail[now]] + 1;
    }
    last = nxt[cur][c];
    ++cnt[last];
}
5、把cnt搞对
inline void dp() {
    for(int i = p - 1; i >= 0; --i) cnt[fail[i]]+= cnt[i];
}

加完所有串之后,dp一下才对。
这个东西极妙,最好背一下板子。

贴一个APIO2014【APIO2014】回文串的codecode

#include <cstdio>
#define N 300010
inline long long mymax(long long x, long long y) {return x > y ? x : y;}
struct Palindromic_Tree {
    int nxt[N][26]; //i节点对应的回文串在两边各加一个字符后变成的节点编号
    int fail[N]; //fail[i]表示的串是i的最长后缀回文串
    int cnt[N]; //表示这个串出现过几次 
    int num[N]; //节点i这个串的后缀有多少是回文的
    int len[N]; //节点i表示的回文串的长度
    int S[N]; //S[i]是第i次添加的字符
    int last; //以n结束的最长回文串所在的节点
    int n; //目前添加的字符个数
    int p; //下一个新建节点的标号
    inline int newnode(int l) {
        //新建节点
        for(int i = 0; i < 26; ++i) nxt[p][i] = 0;
        cnt[p] = num[p] = 0;
        len[p] = l;
        return p++;
    }
    inline void init() {
        p = 0;
        newnode(0);
        newnode(-1);
        last = n = 0;
        S[n] = -1;
        fail[0] = 1;
    }
    inline int get_fail(int x) {
        while(S[n - len[x] - 1] != S[n]) x = fail[x];
        return x;
    }
    inline void add(int c) {
        S[++n] = c;
        int cur = get_fail(last); //通过上一个回文串找这个串的匹配位置
        if(!nxt[cur][c]) {
            //这个回文串从未出现过
            int now = newnode(len[cur] + 2);
            fail[now] = nxt[get_fail(fail[cur])][c]; //和AC自动机简直不要太类似
            nxt[cur][c] = now;
            num[now] = num[fail[now]] + 1;
        }
        last = nxt[cur][c];
        ++cnt[last];
    }
    inline void dp() {
        for(int i = p - 1; i >= 0; --i) cnt[fail[i]]+= cnt[i];
    }
    inline void work() {
        init();
        char c = getchar();
        while(c >= 'a' && c <= 'z') {
            add(c - 'a');
            c = getchar();
        }
        dp(); long long ans = 0;
        for(int i = p - 1; i >= 0; --i) ans = mymax(ans, 1ll * cnt[i] * len[i]);
        printf("%lld", ans);
    }
}pdtree;
int main() {
    pdtree.work();
    return 0;
}
<think>好的,我现在要仔细想想用户的问题:“回文自动机是什么”。首先,我需要确认用户的基础。可能用户已经了解过自动机理论,比如有限自动机(FA)、后缀自动机(SAM)等,但回文自动机可能是一个相对陌生的概念。用户可能是在学习字符串处理相关算法,或者在解决回文问题时遇到了这个数据结构,所以需要了解其基本原理和应用。 首先,我需要回忆回文自动机的定义。回文自动机,也叫作回文树(Palindromic Tree)或Eertree,是由Mikhail Rubinchik和Maxim信息量大的论文提出的,用于高效处理字符串中的所有回文子串的结构。它能够在线性时间内构建,并存储所有的唯一回文子串,同时支持一些查询操作,比如统计不同回文的数量、最长回文等。 接下来,我需要确定回文自动机的结构。回文自动机由节点组成,每个节点代表一个唯一的回文子串。每个节点包含以下信息:回文的长度、后缀链接(指向当前回文的最长真后缀回文)、以及转移边(用于在添加新字符时扩展新的回文)。根节点有两个,分别对应长度为-1和0的虚根,这是为了处理奇偶长度的回文。 然后,构建过程是怎样的呢?比如,假设字符串是“abba”,如何一步步构建自动机。初始时,创建两个根节点。然后逐个字符处理,维护当前最长回文后缀的位置。当添加新字符时,检查是否可以通过当前节点的转移边扩展,如果不行,则创建新节点,并更新后缀链接。这个过程类似于后缀自动机的构建,但专门针对回文结构。 还需要考虑时间复杂度和空间复杂度。根据文献,回文自动机的构建时间复杂度是O(n),其中n是字符串长度。空间复杂度是O(n),因为每个节点代表唯一的回文子串,而一个长度为n的字符串最多有n个不同的回文子串(比如全相同字符的情况,如“aaaaa”有n个回文子串)。 应用方面,回文自动机可以用于统计所有回文子串的数量、找出最长回文子串、计算每个回文出现的次数等。例如,在解决LeetCode上的回文相关问题时,回文自动机可能提供高效的解决方案。 但用户可能需要更具体的例子来理解。比如,构建过程中的步骤,或者如何通过后缀链接快速跳转。可能还需要比较回文自动机与其他方法(如Manacher算法)的异同。Manacher算法用于寻找最长回文子串,而回文自动机则更全面,能够处理所有回文子串的信息。 此外,用户可能想知道如何实现回文自动机。代码结构大致包括节点结构体的定义(包含长度、后缀链接、转移数组),初始化两个根节点,然后逐个字符处理,维护当前节点,并在必要时创建新节点,同时更新后缀链接。 需要注意的细节包括如何处理奇偶长度的回文。两个根节点中,长度为-1的节点用于处理奇长度回文,比如当添加字符时,从该节点出发可以形成长度为1的回文。而长度为0的节点处理偶长度回文。例如,当添加一个字符,当前节点无法扩展时,通过后缀链接回溯,直到找到可以扩展的位置或者到达根节点。 可能遇到的疑问点包括后缀链接的作用。后缀链接指向当前回文的最长真后缀回文,这在构建过程中帮助快速跳转,避免重复检查。例如,当添加新字符后,如果当前节点无法扩展,通过后缀链接找到可能的位置,减少时间复杂度。 最后,总结回文自动机的优势和适用场景。它适合需要处理多个回文子串的问题,尤其是在需要统计或频繁查询的情况下,而不仅仅是寻找最长回文。与动态规划相比,回文自动机在时间和空间上更高效,尤其是当字符串较长时。</think>回文自动机(Palindromic Automaton),又称回文树(Eertree),是一种专门用于高效处理字符串中所有回文子串的数据结构。它能在线性时间内构建,并支持统计唯一回文数量、查询最长回文等功能。 --- ### **核心原理** 1. **节点定义** 每个节点代表一个唯一的回文子串,包含以下信息: - `len`:回文长度 - `fail`:后缀链接(指向当前回文的最长真后缀回文) - `trans[]`:转移边(记录添加字符后形成的新回文) 2. **虚根设计** 有两个特殊根节点: - 虚根1(奇根):长度为 `-1`,用于处理奇数长度回文(如 `"a"`)。 - 虚根2(偶根):长度为 `0`,用于处理偶数长度回文(如 `"aa"`)。 3. **构建过程** 逐个字符处理字符串,维护当前最长回文后缀节点。每添加字符 `c` 时: - 从当前节点出发,沿后缀链接回溯,直到找到可扩展的节点。 - 若扩展成功,新建节点并更新后缀链接。 --- ### **时间复杂度** - **构建复杂度**:$O(n)$,其中 $n$ 为字符串长度。 - **空间复杂度**:$O(n)$,每个节点对应唯一回文子串。 --- ### **应用场景** 1. 统计所有不同回文子串的数量。 2. 查找最长回文子串。 3. 计算每个回文的出现次数。 4. 结合其他算法解决复杂回文问题(如回文分割、动态回文维护)。 --- ### **示例分析** 以字符串 `"abba"` 为例: 1. 初始状态:仅有虚根奇根(`len=-1`)和偶根(`len=0`)。 2. 添加字符 `a`: - 从偶根出发,形成长度为1的奇回文 `"a"`。 3. 添加字符 `b`: - 从 `"a"` 出发,无法扩展,回溯到奇根后新建节点 `"b"`。 4. 添加字符 `b`: - 从当前节点 `"b"` 扩展,形成 `"bb"`(偶回文)。 5. 添加字符 `a`: - 从 `"bb"` 扩展,形成 `"abba"`(偶回文)。 最终,回文自动机包含所有回文子串:`"a"`, `"b"`, `"bb"`, `"abba"`, `"b"`(末尾单独 `b`)。 --- ### **对比其他方法** - **Manacher算法**:仅求最长回文,时间复杂度 $O(n)$,但无法统计所有回文。 - **动态规划**:需 $O(n^2)$ 时间预处理,空间开销大。 - **回文自动机**:综合高效,适合处理多回文查询问题。 --- ### **代码实现要点** ```python class Node: def __init__(self): self.len = 0 # 回文长度 self.fail = None # 后缀链接 self.trans = {} # 转移边(字符→节点) # 初始化虚根 root_odd = Node() root_odd.len = -1 root_even = Node() root_even.len = 0 root_odd.fail = root_even.fail = root_odd # 初始指向自身 ``` --- 回文自动机通过巧妙的后缀链接和转移边设计,将回文处理效率提升到线性级别,是处理复杂回文问题的利器。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值