kmp(next数组的理解运用)HDU2752&&2594&&3336

本文深入解析KMP算法的核心概念,包括next数组的计算、前缀和后缀的比较,以及如何应用于字符串匹配问题。通过三个具体题目,HDU2752、HDU2594和HDU3336,详细展示了KMP算法的实际应用,包括代码实现和状态方程的推导。

HDU2752

前排膜大佬(讲解)
前排膜大佬(图)
我说一下我的理解吧。。。
还是放在代码里看着方便些( ̄□ ̄||)
这里截一个图(是大佬的)
这里写图片描述
理解这个意思就好,代码大同小异。

#pragma warning (disable :4996)
#include<stdio.h>
#include<iostream>
#include<string.h>

#define maxn 400010

using namespace std;
int nex[maxn];

void cal_next(char*str) {          
    int k = -1;                              
    int len = strlen(str);
    nex[0] = -1;
    for (int q = 1; q < len; q++) {
        while (k > -1 && str[k + 1] != str[q]) {
            k = nex[k];
        }
        if (str[k + 1] == str[q]) {
            k++;
        }
        nex[q] = k;
    }
}

int main() {
    char a[maxn];
    int ans[maxn];
    int alen, temp;

    int i=1;
    while (scanf("%s",&a)!=EOF) {
        if (a[0]=='.')break;
        cal_next(a);
        alen = strlen(a);

        ans[alen - i] = nex[alen - 1]+1;    //这里直接找next最后一个数的,这样前缀和后缀必然相同
        //(然后判断前缀或者后缀中是否还含有相同的片段,即前缀的前缀和(前缀的)后缀是否相同)

        temp = alen - 1;
        for (;;) {                       //如此反复可得结果

            if (nex[temp] >=0){
                ans[alen - i] = nex[temp]+1;
                temp = nex[temp];
            }
            else break;
            i++;
        }
        for ( i =alen-i+1; i <alen; i++) { //输出答案
            printf("%d ", ans[i]);
        }
        printf("%d\n",alen);         //最后输出字符串本身
        memset(a, 0, sizeof(a));
        memset(nex, 0, sizeof(nex));
        i = 1;
    }
    return 0;
}

本准备语法高亮的,但是看起来比较难受(chou)
就这样吧。。

HDU2594

这个题其实就是看对next的理解,能不能想到将两个文本串拼接在一起,(将后一个文本串接在第一个文本串的后面)这样就能进行前缀和后缀的比较了。还以一个点就是在进行next的计算后,所得到的(前后缀)相同长度不能超过所给较短的那个字符串的长度。
还有就是输出有空格。。。
虽然都想到了,但是因为直接将cal_nex函数的返回值放在for循环里面导致每一次都要再去函数里面计算一遍,所以就TLE。
难受的一比
仔细想来还是自己菜的一匹。
哎。。。。
话不多数上代码

#include<stdio.h>
#include<iostream>
#include<string.h>
#pragma warning (disable :4996)
#define maxn 50010

using namespace std;
int nex[maxn*2];
//注意题目数据类型,不一定是字符串!!! 
int  cal_nex(char*str ,int len) {           //算出str的前缀和后缀相同的长度 存入next中 
    int k = -1, maxx=-1,mark=0;                                //如next[0]=-1 不存在,next[1]=0 一个相同 
    char ans[maxn];
    memset(ans, 0, sizeof(ans));
    nex[0] = -1;
    int q,len1;
    len1 = strlen(str);
    for ( q = 1; q <len1; q++) {
        while (k > -1 && str[k + 1] != str[q]) {
            k = nex[k];
        }
        if (str[k + 1] == str[q]) {
            k++;
        }
        nex[q] = k;
    }
    while (nex[q-1] >= len){//若当前的nex[]长度大于len,则继续向前找
        q--;
        k--;
    }
    //k是从-1开始,所以+1
    return k+1;
}

int main() {
    char a[maxn], b[maxn],c[maxn*2];
    char ans[maxn]; int len,len_a,len_b;
    while(cin>>a>>b){
        memset(ans, 0, sizeof(ans));
        strcpy(c, a);
        strcat(c, b);//将两个文本串拼在一起
         len_a = strlen(a);
         len_b = strlen(b);
        //cout << c;
        if (len_a > len_b) //记录较小文本串的长度
            len = len_b;
        else len = len_a; 
        len = cal_nex(c, len);
        for (int i = 0; i <len; i++)
            ans[i] = a[i];
        if (strlen(ans) == 0)
            printf("0\n");
        else printf("%s %d\n", ans,len);

    }
    return 0;
}

HDU3336

老规矩,先膜大佬
大佬说这个题其实是next数组的跳转???
lno

KMP+DP真的有点难受。。
看了很久,状态方程还是要自己试一遍才更容易理解。
这里的贴一下状态方程dp[i] = dp[nex[i]+1] + 1
这里dp[nex[i]+1] 是因为我的k从-1算起。
这里讲一下我的理解吧。。
dp**从1开始计数**
nex数组也是从1开始
dp[i]代表的就是文本串前(i-1)个字符中以第i个字母为结尾的个数而后面的“+1”代表自己本身
然后dp是初始化为0
大概就是这样了。。。
AC代码。。

#include<stdio.h>
#include<iostream>
#include<string.h>
#pragma warning (disable: 4996);
#define maxn 200010 
#define mod 10007
using namespace std;

int nex[maxn];
void cal_next(char*str) {           //算出str的前缀和后缀相同的长度 存入next中 

    int k = -1;                                //例:next[0]=-1 不存在,next[1]=0 一个相同 
    int len = strlen(str);
    nex[0]=nex[1] = -1;//next从1开始
    for (int q = 1; q <len; q++) {
        while (k >-1 && str[k + 1] != str[q]) {
            k = nex[k];
        }
        if (str[k + 1] == str[q]) {
            k++;
        }
        nex[q+1] = k;//这里向后移一位

    }/*
    for (int i = 0; i < len; i++)
        cout << nex[i];
*/
}

int main() {
    char a[maxn];
    int dp[maxn];
    int T,num;
    int ans;

    scanf("%d", &T);
    while (T--) {
        ans = 0;
        memset(a, 0, sizeof(a));
        memset(dp, 0, sizeof(dp));
        memset(nex, 0, sizeof(nex));
        scanf("%d", &num);
        scanf("%s", &a);

        cal_next(a);

        for (int i = 1; i <=num; i+=1) {//这里是从1开始
            dp[i] = dp[nex[i]+1] + 1;
            ans = (ans + dp[i]) % mod;//值就是每个dp[i]的和
        }

        printf("%d\n", ans);
    }
    return 0;
}
### KMP算法中的Next数组概念与实现 #### Next数组的作用 在KMP(Knuth-Morris-Pratt)算法中,`next` 数组是一个非常重要的组成部分。它的主要功能是用来记录模式串中前缀和后缀的最大重合长度[^1]。通过这种机制,在主串和模式串不匹配的情况下,能够快速跳过不必要的比较过程,从而提高字符串匹配效率。 具体来说,`next[i]` 表示的是模式串中从起始位置到第 `i-1` 位之间的子串中,最长相等前后缀的长度[^2]。这里的“前缀”是指不包含最后一个字符的所有头部组合,“后缀”则是指不包含第一个字符的所有尾部组合。 #### Next数组的构造方法 构建 `next` 数组的过程实际上是对模式串自身的分析。以下是具体的计算逻辑: 1. **初始化** 定义两个变量 `i` 和 `j`,其中 `i` 是当前正在处理的位置索引,而 `j` 则表示已经找到的最长公共前后缀的结束位置加一(即下一个待比较的位置)。初始状态设为 `j = 0, i = 1`[^3]。 2. **逐步填充 next 数组** - 如果 `pattern[j] == pattern[i]`,说明找到了一个新的匹配项,则令 `next[i] = j + 1` 并同时增加 `i` 和 `j` 的值继续向右移动。 - 若两者不同,则需要回溯寻找更短的可能匹配路径。此时应让 `j = next[j-1]` 来尝试缩短匹配范围直到满足条件或者回到起点为止(`j=0`)。 3. **特殊情况处理** 当遍历完成整个模式串之后即可得到完整的 `next[]` 数组用于后续实际匹配过程中指导跳跃动作。 下面是基于上述描述的一个简单 Python 实现版本: ```python def compute_next(pattern): n = len(pattern) next_array = [0]*n j = 0 for i in range(1, n): while j > 0 and pattern[i] != pattern[j]: j = next_array[j-1] if pattern[i] == pattern[j]: j += 1 next_array[i] = j return next_array ``` 此函数接收一个参数——目标查找字串 (Pattern),返回其对应的 next 数组列表形式的结果集。 #### 使用案例解释 假设给定模式串 `"ABABC"` ,按照上面定义的方法一步步推导出最终结果如下表所示: | Index | Character | Longest Prefix Suffix Length (`next[i]`) | |-------|-----------|------------------------------------------| | 0 | A | 0 | | 1 | B | 0 | | 2 | A | 1 | | 3 | B | 2 | | 4 | C | 0 | 因此对于该例子而言,所生成的 next 数组应该是 `[0, 0, 1, 2, 0]`. --- ###
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值