关于KMP的next数组

明明写的和课本一样,但是在PTA就是不正确,参考了别人的答案,发现有一个地方不一样记录一下!

#include<stdio.h>
#include<stdlib.h>
#include<string.h>
int next1[1000];
//next1[j] = k,表示当T[i] != P[j]时,j指针的下一个位置。
//求字串在主串中第一次出现的位置
void get_next1(char T[1000],int next1[],int len)
{
    int i=1,j=0;
    next1[1]=0;
    while(i<len)
    {
        if(j==0||T[i-1]==T[j-1])
        {
            ++i;
            ++j;
            next1[i]=j;
        }
        else
            j=next1[j];
    }

}
int main()
{
    char s1[1000],s2[1000];
    gets(s1);
    gets(s2);

    int len1=strlen(s1);
    int len2=strlen(s2);
//    if(len1>len2)
//    {
//        printf("  0");
//        return 0;
//    }
//    int flag=1;
    get_next1(s1,next1,len1);
    int i,j;
    for(i=1; i<=len1; i++)
        printf("%3d",next1[i]);
    printf("\n");

    i=0,j=0;
        while(i<len1&&j<len2)
        {
            if(s1[i]==s2[j])
            {
                i++;
                j++;
            }
            else
            {

                j=j-i+1;
                i=0;
            }
        }
        if(i==len1)
        {
            printf("%3d",j-i+1);
//            flag=1;
        }
        else
            printf("  0");

//    if(flag==0)
//        printf("  0");

    return 0;




}

### KMP算法中的Next数组概念与实现 #### Next数组的作用 在KMP(Knuth-Morris-Pratt)算法中,`next` 数组是一个非常重要的组成部分。它的主要功能是用来记录模式串中前缀和后缀的最大重合长度[^1]。通过这种机制,在主串和模式串不匹配的情况下,能够快速跳过不必要的比较过程,从而提高字符串匹配效率。 具体来说,`next[i]` 表示的是模式串中从起始位置到第 `i-1` 位之间的子串中,最长相等前后缀的长度[^2]。这里的“前缀”是指不包含最后一个字符的所有头部组合,“后缀”则是指不包含第一个字符的所有尾部组合。 #### Next数组的构造方法 构建 `next` 数组的过程实际上是对模式串自身的分析。以下是具体的计算逻辑: 1. **初始化** 定义两个变量 `i` 和 `j`,其中 `i` 是当前正在处理的位置索引,而 `j` 则表示已经找到的最长公共前后缀的结束位置加一(即下一个待比较的位置)。初始状态设为 `j = 0, i = 1`[^3]。 2. **逐步填充 next 数组** - 如果 `pattern[j] == pattern[i]`,说明找到了一个新的匹配项,则令 `next[i] = j + 1` 并同时增加 `i` 和 `j` 的值继续向右移动。 - 若两者不同,则需要回溯寻找更短的可能匹配路径。此时应让 `j = next[j-1]` 来尝试缩短匹配范围直到满足条件或者回到起点为止(`j=0`)。 3. **特殊情况处理** 当遍历完成整个模式串之后即可得到完整的 `next[]` 数组用于后续实际匹配过程中指导跳跃动作。 下面是基于上述描述的一个简单 Python 实现版本: ```python def compute_next(pattern): n = len(pattern) next_array = [0]*n j = 0 for i in range(1, n): while j > 0 and pattern[i] != pattern[j]: j = next_array[j-1] if pattern[i] == pattern[j]: j += 1 next_array[i] = j return next_array ``` 此函数接收一个参数——目标查找字串 (Pattern),返回其对应的 next 数组列表形式的结果集。 #### 使用案例解释 假设给定模式串 `"ABABC"` ,按照上面定义的方法一步步推导出最终结果如下表所示: | Index | Character | Longest Prefix Suffix Length (`next[i]`) | |-------|-----------|------------------------------------------| | 0 | A | 0 | | 1 | B | 0 | | 2 | A | 1 | | 3 | B | 2 | | 4 | C | 0 | 因此对于该例子而言,所生成的 next 数组应该是 `[0, 0, 1, 2, 0]`. --- ###
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值