扩展KMP ( Next数组 )——Simpson's Hidden Talents ( HDU 2594 )

  • 题目链接:
    http://acm.hdu.edu.cn/showproblem.php?pid=2594

  • 分析: 给出两个字符串S1,S2,求出一个最长子串(既是S1 的前缀又是S2的后缀),一开始是打算用完整的扩展KMP去做,但是结果迷之WA,后来改成合并字符串,把S2接S1后面,然后获取整个字符串的Next数组来做。

  • 题解:

    1. 从strlen(s1)的地方开始遍历Next数组,这个时候找S[strlen(s1)]到末尾的后缀与S的前缀的最大匹配,就是题目要求的意思:
    2. L = strlen(s1);
      for(int i = L; i< l1; i++)
      {
      
          int now = Next[i];
      
          if(i+Next[i] == l1)//如果长度和整个长度相等,那么说明s2的【后缀】和s1的前缀匹配上
          {
              ans = max(ans , now ) ;//取最大值
          }
      }
      ans = ans >= L ? L : ans ;//不超过s1的长度
    3. Next数组求法

    4. const int Max=50000+10;
      int Next[Max*2]; //ex数组即为extend数组
      void GETNext(char *str)
      {
          Clear(Next);
          int i=0,j,po,len=strlen(str);
          Next[0]=len;//初始化Next[0]
          while(str[i]==str[i+1]&&i+1<len)//计算Next[1]
              i++;
          Next[1]=i;
          po=1;//初始化po的位置
          for(i=2;i<len;i++)
          {
              if(Next[i-po]+i<Next[po]+po)//第一种情况,可以直接得到Next[i]的值
                  Next[i]=Next[i-po];
              else//第二种情况,要继续匹配才能得到Next[i]的值
              {
                  j=Next[po]+po-i;
                  if(j<0)   j=0;//如果i>po+Next[po],则要从头开始匹配
                  while(i+j<len&&str[j]==str[j+i])//计算Next[i]
                      j++;
                  Next[i]=j;
                  po=i;//更新po的位置
              }
          }
      }
  • AC代码:

#include <iostream>
#include <cstring>
#include <cstdio>
#include <queue>
#include <algorithm>
#include <cmath>
#define Clear(a)   memset(a, 0, sizeof(a))
using namespace std;

const int Max=50000+10;
int Next[Max*2]; //ex数组即为extend数组
void GETNext(char *str)
{
    Clear(Next);
    int i=0,j,po,len=strlen(str);
    Next[0]=len;//初始化Next[0]
    while(str[i]==str[i+1]&&i+1<len)//计算Next[1]
        i++;
    Next[1]=i;
    po=1;//初始化po的位置
    for(i=2;i<len;i++)
    {
        if(Next[i-po]+i<Next[po]+po)//第一种情况,可以直接得到Next[i]的值
            Next[i]=Next[i-po];
        else//第二种情况,要继续匹配才能得到Next[i]的值
        {
            j=Next[po]+po-i;
            if(j<0)   j=0;//如果i>po+Next[po],则要从头开始匹配
            while(i+j<len&&str[j]==str[j+i])//计算Next[i]
                j++;
            Next[i]=j;
            po=i;//更新po的位置
        }
    }
}


char s1[Max*2];
char s2[Max*2];

int main()
{
    while(~scanf("%s", &s1) )
    {
        int L = strlen(s1);
        scanf("%s", s1+L);
        GETNext(s1);
        int l1 = strlen(s1);
        int ans = -1;
        for(int i = L;i<l1;i++)
        {
            int now = Next[i];
            if(i+Next[i] == l1)
            {
                ans = max(ans , now ) ;
            }
        }
        ans = ans >= L ? L : ans ;
        for(int i=0;i<ans;i++)
        {
            cout << s1[i];
        }

        if(ans>=0)
        {
            cout << " " << ans << endl;
        }
        else
            cout << 0 << endl;
    }
    return 0;
}
### KMP算法中next数组的求解方法 KMP算法是一种高效的字符串匹配算法,其中`next`数组用于记录模式串中每个位置对应的最长相等前缀和后缀的长度。以下是关于如何计算`next`数组的具体说明: #### 1. `next`数组初始化 在计算`next`数组之前,需要对其进行初始化操作。通常情况下,`next[0]`被设置为 `-1` 或者 `0`,这取决于具体的实现方式[^1]。 ```cpp int next[LEN]; next[0] = -1; ``` 这种初始值的意义在于处理特殊情况下的回溯逻辑。如果第一个字符就发生失配,则可以直接跳过当前比较并继续寻找下一个可能的起始点。 #### 2. 双指针法构建`next`数组 通过双指针的方式逐步填充整个`next`数组。定义两个变量`i` 和 `j`分别作为主循环索引和辅助索引来完成这一过程: - **`i`:** 表示正在处理的模式串中的位置; - **`j`:** 记录的是上一次成功匹配到的最大公共前后缀结束处的位置; 具体流程如下所示: ```cpp void getNext(string p, int *next){ int i = 0, j = -1; next[0] = -1; while (i < p.length()){ if (j == -1 || p[i] == p[j]){ ++i; ++j; next[i] = j; // 当前状态转移至下一阶段 } else{ j = next[j]; // 失败时回退至上一最佳匹配点 } } } ``` 上述代码片段展示了完整的`getNext()`函数实现细节。每当遇到新的字符或者发现已有部分能够构成更长的有效子序列时都会更新相应的`next[]`项值。 #### 3. 关键特性解析 - **基础性质**: 对于任意给定位置k而言,在其前面的所有子串里找到最右侧且尽可能靠近该位的一个相同开头结尾的部分即可得到对应entry of array 'next'[k]. - **增长规律**: 每次迭代过程中要么维持不变(`p[i]==p[j]`)使得新加入的一对保持一致从而增加计数值;要么减少尝试回到先前已知较短但依然满足条件的状态下去探索更多可能性[`j=next[j]`]直到再次达成共识为止. - **独立性**: 特别值得注意的是尽管最终形成的整体结构依赖于全局信息但是每一个单独元素仅仅由它左侧范围内的局部数据决定出来所以可以顺序地一步步构造起来而无需顾虑后面尚未访问过的区域会对现在造成干扰影响[^2]. #### 示例分析 考虑一个简单的例子来加深理解:`abacababc`. | Index | Character | Longest Prefix Suffix Length (`next`) | |-------|-----------|--------------------------------------| | 0 | a | -1 | | 1 | b | 0 | | 2 | a | 0 | | 3 | c | 1 | | 4 | a | 1 | | 5 | b | 2 | | 6 | a | 2 | | 7 | b | 3 | | 8 | c | 4 | 在这个表格当中我们可以清晰看到随着输入逐渐扩展每一步是如何依据既存关系推导出来的结果[^3]. ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值