洛谷P3375【模板】KMP算法-字符串匹配

本文深入探讨KMP算法,一种高效的字符串匹配算法,用于在主串中查找子串的所有出现位置。通过实例演示,文章详细解释了如何构建前缀数组next,并提供了完整的C++代码实现,帮助读者理解并掌握KMP算法的工作原理。

题目描述

如题,给出两个字符串s1和s2,其中s2为s1的子串,求出s2在s1中所有出现的位置。

为了减少骗分的情况,接下来还要输出子串的前缀数组next。

(如果你不知道这是什么意思也不要问,去百度搜[kmp算法]学习一下就知道了。)

输入输出格式

输入格式:

 

第一行为一个字符串,即为s1

第二行为一个字符串,即为s2

 

输出格式:

 

若干行,每行包含一个整数,表示s2在s1中出现的位置

接下来1行,包括length(s2)个整数,表示前缀数组next[i]的值。

 

输入输出样例

输入样例#1: 复制

ABABABC
ABA

输出样例#1: 复制

1
3
0 0 1 

说明

时空限制:1000ms,128M

数据规模:

设s1长度为N,s2长度为M

对于30%的数据:N<=15,M<=5

对于70%的数据:N<=10000,M<=100

对于100%的数据:N<=1000000,M<=1000000

样例说明:

所以两个匹配位置为1和3,输出1、3

//
//  洛谷P3375-KMP.cpp
//  Cheese
//
//  Created by 廖启帆 on 2019/4/4.
//  Copyright © 2019 廖启帆. All rights reserved.
//

/*
 ABABABC
 ABA
 
 1
 3
 0 0 1
 */

#include <cstdio>
#include <cstring>
#include <iostream>
using namespace std;

int kmpcount(char text[],char pattern[]);
void getnext(char s[],long len);

int nexts[1000100]={0};
char text[1000100],pattern[1000100];

int main()
{
    int i;
    long len;
    cin>>text>>pattern;
    len=strlen(pattern);
    
    kmpcount(text, pattern);
    for (i=0; i<len; i++) {
        printf("%d ",nexts[i]+1);
    }
    
    return 0;
}

int kmpcount(char text[],char pattern[]) {      //统计pattern在text中出现的次数
    int i,j=-1,count=0;     //count表示成功匹配次数
    long n=strlen(text),m=strlen(pattern);      //字符串长度
    getnext(pattern, m);        //计算pattern的nexts数组
    
    for (i=0; i<n; i++) {       //试图匹配text[i]
        while (j!=-1&&text[i]!=pattern[j+1]) {      //直到j回到-1或text[i]==pattern[j+1]
            j=nexts[j];     //不断回退
        }
        if (text[i]==pattern[j+1]) {        //text[i]与pattern[j+1]匹配成功
            j++;        //令j+1
        }
        if (j==m-1) {       //pattern完全匹配,说明pattern是text的子串
            count++;        //成功匹配次数+1
            cout<<i-m+2<<endl;
            j=nexts[j];     //让j回退到nexts[j]继续匹配
        }
    }
    return count;       //返回成功匹配次数
}

void getnext(char s[],long len) {        //求解长度为len的字符串s的next数组
    int i,j;
    nexts[0]=-1;        //nexts[i]为子串s[0~i]的最长相等前后缀最后一位的下标
    j=nexts[0];     //初始化j=nexts[0]=-1
    
    for (i=1; i<len; i++) {     //求解nexts[1]~nexts[len-1]
        while (j!=-1&&s[i]!=s[j+1]) {       //直到j回退到-1或是s[i]==s[j+1]
            j=nexts[j];     //反复令j=nexts[j]
        }
        if (s[i]==s[j+1]) {     //如果s[i]==s[j+1]
            j++;        //则nexts[i]=j+1,先令j指向这个位置
        }
        nexts[i]=j;     //令nexts[i]=j
    }
}

 

### 关于平台上的相似字符串题目与算法平台上,与“相似字符串”相关的题目通常涉及字符串匹配、编辑距离或字符比较等算法。根据提供的引用内容[^1],判断两个字符串是否相似可以通过以下方法实现: #### 1. 字符串长度相等的情况 如果两个字符串的长度相等,则可以通过统计不同字符的个数来判断它们是否相似。如果不同字符的个数不超过1,则认为一个字符串可以通过修改一个字符变成另一个字符串,从而判定为相似[^1]。 #### 2. 字符串长度差为1的情况 当两个字符串的长度差为1时,较长的字符串通过删除一个字符可以变成较短的字符串。具体实现方法是从左到右同时遍历两个字符串,找到第一个不同的字符位置。如果从该位置开始,较长字符串的剩余部分与较短字符串的剩余部分相同,或者较长字符串的剩余部分与较短字符串的下一个位置开始的剩余部分相同,则它们相似[^1]。 #### 3. 字符串长度差大于1的情况 如果两个字符串的长度差大于1,则直接判定它们不相似[^1]。 #### 平台上的相关题目 在平台上,与字符串相似性相关的题目可能包括但不限于以下几种类型: - **KMP算法**:KMP算法是一种高效的字符串匹配算法,其核心是利用匹配失败后的信息减少不必要的匹配操作[^2]。上有一道经典的KMP模板题P3375模板KMP字符串匹配[^3]。 - **编辑距离问题**:这类问题通常要求计算将一个字符串转换为另一个字符串所需的最少操作次数(如插入、删除或替换字符)。虽然这不是严格意义上的“相似字符串”问题,但与字符串相似性的概念密切相关。 - **字符比较问题**:类似于引用中的描述,这类问题可能要求判断两个字符串是否可以通过特定的操作(如修改、删除或插入字符)变得相似。 #### 示例代码:KMP算法实现 以下是一个基于C++的KMP算法实现示例,用于解决字符串匹配问题: ```cpp #include <bits/stdc++.h> using namespace std; char A[1000005], B[1000005]; int nxt[1000005]; int main() { scanf("%s%s", A, B); int i = 0, j = 0; int n = strlen(A), m = strlen(B); nxt[0] = 0; i++; while (i < n) { j = nxt[i - 1]; while (j && B[i] != B[j]) j = nxt[j - 1]; if (B[i] == B[j]) nxt[i] = j + 1; else nxt[i] = 0; i++; } i = 0; while (i < n) { while (j && A[i] != B[j]) j = nxt[j - 1]; if (A[i] == B[j]) j++; if (j == m) { int ans = i - j + 1; j = nxt[j - 1]; cout << ans << endl; } i++; } for (int i = 0; i < m; i++) printf("%d ", nxt[i]); return 0; } ``` 此代码实现了KMP算法的核心逻辑,并输出了模式串的部分匹配表(next数组)。 ###
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值