AcWing 831. KMP字符串

本文深入解析KMP算法,一种高效的字符串匹配算法,用于在模式串中查找模板串的所有出现位置。通过实例演示如何构建next数组并进行模式匹配,适用于大数据量的字符串搜索场景。

给定一个模式串S,以及一个模板串P,所有字符串中只包含大小写英文字母以及阿拉伯数字。

模板串P在模式串S中多次作为子串出现。

求出模板串P在模式串S中所有出现的位置的起始下标。

输入格式

第一行输入整数N,表示字符串P的长度。

第二行输入字符串P。

第三行输入整数M,表示字符串S的长度。

第四行输入字符串S。

输出格式

共一行,输出所有出现位置的起始下标(下标从0开始计数),整数之间用空格隔开。

数据范围

1≤N≤1051≤N≤105
1≤M≤1061≤M≤106

输入样例:

3
aba
5
ababa

输出样例:

0 2
import java.io.*;
import java.lang.Integer;

class Main{
    static void next(int[] next, String s){//构造next前后缀数组
        int len = s.length();
        int i = 0, j = -1;
        next[0] = -1;
        while(i < len){
            if(j == -1 || s.charAt(i) == s.charAt(j)){
                i++;
                j++;
                next[i] = j;
            }else{
                j = next[j];
            }
        }
    }
    public static void main(String[] args)throws Exception{
        BufferedReader buf = new BufferedReader(new InputStreamReader(System.in));
        BufferedWriter buw = new BufferedWriter(new OutputStreamWriter(System.out));
        int n = Integer.valueOf(buf.readLine());
        String s = buf.readLine();
        int m = Integer.valueOf(buf.readLine());
        String p = buf.readLine();
        int[] next = new int[n + 10];//其实加1就可以了,因为kmp求next数组需要用到length+1位
        next(next, s);
        int i = 0, j = 0;
        while(i < m && j < n){
            if(j == -1 || p.charAt(i) == s.charAt(j)){//j == -1的目的是如果整个串都不匹配只能让i,j向后移动一位,重新开始匹配
                i++;
                j++;
            }else{
                j = next[j];
            }
            if(j == n){
                buw.write(i - j + " ");
                System.out.print(j);
                j = next[j];//匹配完成,此时j已经越界,此处返回到上一个next数组(模式串的最大前后缀)的值
            }
        }
        buw.flush();
        buf.close();
        buw.close();
    }
}

参考:

KMP 算法 https://ethsonliu.com/2018/04/kmp.html

### AcWing KMP 字符串匹配算法实现与应用 #### KMP 算法简介 KMP(Knuth-Morris-Pratt)算法是一种高效的字符串匹配算法,能够在模式串长度为 \( M \),文本长度为 \( N \) 的情况下,在最坏时间复杂度 \( O(N + M) \) 内完成匹配操作。 #### 前缀函数计算 前缀函数数组 `ne` 是 KMP 算法的核心部分之一。对于给定模式串 `str1`,其前缀函数定义如下: \[ ne[i] = max\{k | k < i, s[0...k-1]=s[i-k...i-1]\} \] 即表示位置 \( i \) 处最长相同前后缀的长度[^1]。 ```cpp for (int i = 2, j = 0; i <= m; i++) { while (j && str1[i] != str1[j + 1]) j = ne[j]; if (str1[j + 1] == str1[i]) j++; ne[i] = j; } ``` 这段代码用于构建模式串 `str1` 的前缀函数数组 `ne`,其中变量 `m` 表示模式串的长度。 #### 主体匹配过程 当已经得到了模式串对应的前缀函数之后,可以利用该信息来加速实际的字符串匹配流程。具体做法是从头到尾扫描目标字符串,并尝试寻找是否存在子序列等于模式串的情况。 如果遇到不匹配字符,则通过调整指针的位置跳过不可能成为解的部分;而一旦发现完全一致的情形便记录下起始索引作为答案的一部分[^2]。 ```cpp vector<int> match(string text, string pattern){ int n=text.size(), m=pattern.size(); vector<int> res; // 构建 next 数组 vector<int> next(m+1); for(int i=2,j=0;i<=m;++i){ while(j&&pattern[i]!=pattern[j+1]) j=next[j]; if(pattern[i]==pattern[j+1]) ++j; next[i]=j; } // 开始匹配 for(int i=1,j=0;i<=n;++i){ while(j&&text[i]!=pattern[j+1]) j=next[j]; if(text[i]==pattern[j+1]) ++j; if(j==m){ res.push_back(i-m); j=next[j]; } } return res; } ``` 此 C++ 函数实现了完整的 KMP 匹配逻辑,接受两个参数分别为待搜索的大文本以及要找的小片段,返回所有可能存在的开始位置列表。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值