Manacher(马拉车)算法

本文详细介绍Manacher算法,一种用于寻找字符串中最长回文子串的高效算法。文章首先解释了回文串的概念,并通过实例展示了如何利用Manacher算法在线性时间内解决问题。文中还介绍了Manacher算法的具体步骤和时间复杂度分析。

Manacher算法

算法总结第三弹 manacher算法,前面讲了两个字符串相算法——kmp和拓展kmp,这次来还是来总结一个字符串算法,manacher算法,我习惯叫他 “马拉车”算法。

相对于前面介绍的两个算法,Manacher算法的应用范围要狭窄得多,但是它的思想和拓展kmp算法有很多共通支出,

所以在这里介绍一下。Manacher算法是查找一个字符串的最长回文子串的线性算法。

在介绍算法之前,首先介绍一下什么是回文串,所谓回文串,简单来说就是正着读和反着读都是一样的字符串,比如abba,noon等等,一个字符串的最长回文子串即为这个字符串的子串中,是回文串的最长的那个。

计算字符串的最长回文字串最简单的算法就是枚举该字符串的每一个子串,并且判断这个子串是否为回文串,这个算法的时间复杂度为O(n^3)的,显然无法令人满意,稍微优化的一个算法是枚举回文串的中点,这里要分为两种情况,一种是回文串长度是奇数的情况,另一种是回文串长度是偶数的情况,枚举中点再判断是否是回文串,这样能把算法的时间复杂度降为O(n^2),但是当n比较大的时候仍然无法令人满意,Manacher算法可以在线性时间复杂度内求出一个字符串的最长回文字串,达到了理论上的下界。

1.Manacher算法原理与实现

下面介绍Manacher算法的原理与步骤。

首先,Manacher算法提供了一种巧妙地办法,将长度为奇数的回文串和长度为偶数的回文串一起考虑,具体做法是,在原字符串的每个相邻两个字符中间插入一个分隔符,同时在首尾也要添加一个分隔符,分隔符的要求是不在原串中出现,一般情况下可以用#号。下面举一个例子:


(1)Len数组简介与性质

Manacher算法用一个辅助数组Len[i]表示以字符T[i]为中心的最长回文字串的最右字符到T[i]的长度,比如以T[i]为中心的最长回文字串是T[l,r],那么Len[i]=r-i+1。

对于上面的例子,可以得出Len[i]数组为:



Len数组有一个性质,那就是Len[i]-1就是该回文子串在原字符串S中的长度,至于证明,首先在转换得到的字符串T中,所有的回文字串的长度都为奇数,那么对于以T[i]为中心的最长回文字串,其长度就为2*Len[i]-1,经过观察可知,T中所有的回文子串,其中分隔符的数量一定比其他字符的数量多1,也就是有Len[i]个分隔符,剩下Len[i]-1个字符来自原字符串,所以该回文串在原字符串中的长度就为Len[i]-1。

有了这个性质,那么原问题就转化为求所有的Len[i]。下面介绍如何在线性时间复杂度内求出所有的Len。

(2)Len数组的计算

首先从左往右依次计算Len[i],当计算Len[i]时,Len[j](0<=j<i)已经计算完毕。设P为之前计算中最长回文子串的右端点的最大值,并且设取得这个最大值的位置为po,分两种情况:

第一种情况:i<=P

那么找到i相对于po的对称位置,设为j,那么如果Len[j]<P-i,如下图:



那么说明以j为中心的回文串一定在以po为中心的回文串的内部,且j和i关于位置po对称,由回文串的定义可知,一个回文串反过来还是一个回文串,所以以i为中心的回文串的长度至少和以j为中心的回文串一样,即Len[i]>=Len[j]。因为Len[j]<P-i,所以说i+Len[j]<P。由对称性可知Len[i]=Len[j]。

如果Len[j]>=P-i,由对称性,说明以i为中心的回文串可能会延伸到P之外,而大于P的部分我们还没有进行匹配,所以要从P+1位置开始一个一个进行匹配,直到发生失配,从而更新P和对应的po以及Len[i]。



第二种情况: i>P

如果i比P还要大,说明对于中点为i的回文串还一点都没有匹配,这个时候,就只能老老实实地一个一个匹配了,匹配完成后要更新P的位置和对应的po以及Len[i]。



2.时间复杂度分析

Manacher算法的时间复杂度分析和Z算法类似,因为算法只有遇到还没有匹配的位置时才进行匹配,已经匹配过的位置不再进行匹配,所以对于T字符串中的每一个位置,只进行一次匹配,所以Manacher算法的总体时间复杂度为O(n),其中n为T字符串的长度,由于T的长度事实上是S的两倍,所以时间复杂度依然是线性的。

下面是算法的实现,注意,为了避免更新P的时候导致越界,我们在字符串T的前增加一个特殊字符,比如说‘$’,所以算法中字符串是从1开始的。

[cpp]  view plain  copy
  1. const int maxn=1000010;  
  2. char str[maxn];//原字符串  
  3. char tmp[maxn<<1];//转换后的字符串  
  4. int Len[maxn<<1];  
  5. //转换原始串  
  6. int INIT(char *st)  
  7. {  
  8.     int i,len=strlen(st);  
  9.     tmp[0]='@';//字符串开头增加一个特殊字符,防止越界  
  10.     for(i=1;i<=2*len;i+=2)  
  11.     {  
  12.         tmp[i]='#';  
  13.         tmp[i+1]=st[i/2];  
  14.     }  
  15.     tmp[2*len+1]='#';  
  16.     tmp[2*len+2]='$';//字符串结尾加一个字符,防止越界  
  17.     tmp[2*len+3]=0;  
  18.     return 2*len+1;//返回转换字符串的长度  
  19. }  
  20. //Manacher算法计算过程  
  21. int MANACHER(char *st,int len)  
  22. {  
  23.      int mx=0,ans=0,po=0;//mx即为当前计算回文串最右边字符的最大值  
  24.      for(int i=1;i<=len;i++)  
  25.      {  
  26.          if(mx>i)  
  27.          Len[i]=min(mx-i,Len[2*po-i]);//在Len[j]和mx-i中取个小  
  28.          else  
  29.          Len[i]=1;//如果i>=mx,要从头开始匹配  
  30.          while(st[i-Len[i]]==st[i+Len[i]])  
  31.          Len[i]++;  
  32.          if(Len[i]+i>mx)//若新计算的回文串右端点位置大于mx,要更新po和mx的值  
  33.          {  
  34.              mx=Len[i]+i;  
  35.              po=i;  
  36.          }  
  37.          ans=max(ans,Len[i]);  
  38.      }  
  39.      return ans-1;//返回Len[i]中的最大值-1即为原串的最长回文子串额长度   
  40.   }  
### 实现与解释拉车算法 #### 一、算法概述 拉车算法Manacher's Algorithm)用于在线性时间内查找字符串中的最长回文子串。该算法通过巧妙地处理奇偶长度的回文问题,使得整个过程可以在 O(n) 时间复杂度下完成[^1]。 #### 二、算法过程分析 ##### 1. 字符串预处理 为了统一处理不同长度的回文情况,通常会在原字符串之间插入特殊字符 `#` ,并添加头尾两个不同的保护字符 `$` 和 `@` 。这样做的目的是让所有的回文中心都有一个明确的位置,并且不会越界访问[^2]。 例如:"abba" 被转换成 "$#a#b#b#a#@" ##### 2. 原字符串与新字符串的关联 经过上述变换后的字符串称为辅助串 S' , 对应位置 i 处的最大半径 P[i] 表示以第i个字符为中心能扩展出去最远距离的一半加一 (即实际回文长度除以2再加1)[^3]。 ##### 3. 利用已知信息加速计算 在遍历过程中维护三个变量:当前最大右端点 id, 当前最大右侧边界 mr 及其对应的中心 pos;当遇到新的待求解点 j 时分两种情况进行讨论: ###### 3.1 维护数据 如果j位于mr之内,则尝试借用pos处的信息来减少不必要的比较次数;否则直接从零开始匹配直到无法继续为止。 ###### 3.2 初始化规则 根据 j 是否处于已有记录的有效区间内采取不同策略初始化 p[j]: - **若 j 属于有效区域** :设 k=2*pos-j 即关于pos对称的那个索引位上的值作为初始估计值 min(p[k], mr-j+1), 这样既考虑到了镜像关系又防止超出范围; - **反之则置为默认最小值1**, 因为我们至少知道它自己本身构成的一个单字符回文. ###### 3.3 探测阶段 无论哪种情形都需要进一步验证是否存在更长的可能性,具体做法是从p[j]-1往两侧逐次试探直至不满足条件停止更新p[j][^3]。 最后每当发现更大的mr就及时刷新id和pos以便后续节点能够受益于此优化措施. ```python def manacher(s): # Preprocess the string to handle even-length palindromes uniformly. t = '#'.join(f'^{s}$') n = len(t) p = [0]*n center = right = 0 max_len = 0 index = 0 for i in range(1,n-1): mirror = 2 * center - i if right > i: p[i] = min(right-i,p[mirror]) while t[i+(1+p[i])] == t[i-(1+p[i])]: p[i]+=1 if i + p[i]>right: center=i right=center+p[i] if p[i]>max_len: max_len=p[i] index=i start=(index-max_len)//2 return s[start:start+max_len] ``` 此代码实现了完整的拉车算法逻辑,包括必要的预处理步骤以及核心循环结构,最终返回输入字符串中最长连续回文子序列的内容。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值