KMP

本文详细介绍KMP算法的核心思想及其实现过程,并通过实例演示如何利用KMP算法解决字符串匹配问题。文章提供了完整的C++代码实现,帮助读者理解并掌握KMP算法。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

KMP模板

#include <cstdio>
#include <string.h>
#include <iostream>
using namespace std;

char T[1000], P[1000];
int f[1000];

void getf()
{
    int m = strlen(P);
    f[0] = 0, f[1] = 0;
    for(int i = 1; i < m; i++){
        int j = f[i];
        while(j && P[i] != P[j]) j = f[j];
        if(P[i] == P[j]) j++;
        f[i+1] = j;
    }
}

void KMP()
{
    int n = strlen(T), m = strlen(P), flag = 0;
    getf();//预处理
    int j = 0; //当前结点编号,起始点为0号结点
    for(int i = 0; i < n; i++){
        while(j && P[j] != T[i]) j = f[j];
        if(P[j] == T[i]) j++;
        if(j == m) {printf("找到了,起始位置(字符串开头位置为1):%d\n", i-m+2); j = f[j]; flag = 1;}
    }
    if(flag == 0) printf("未找到匹配字符串\n");
}

int main()
{
    printf("请输入模板字符串:");
    while(scanf("%s", T) != EOF){
        getchar();
        printf("请输入需要匹配的字符串:");
        while(cin >> P && P[0] != '#'){
            getchar();
            KMP();
            printf("请输入需要匹配的字符串:");
        }
        printf("请输入模板字符串:");
    }
    return 0;
}


KMP算法例题

题目1 http://poj.org/problem?id=3461

//poj 3461 Oulipo 最简单的KMP题,找出第一个字符串在第二个字符串中出现次数。

#include <cstdio>
#include <string.h>
#include <iostream>
using namespace std;

char T[1000010], P[1000010];
int f[1000010], flag;

void getf()
{
    int m = strlen(P);
    f[0] = 0, f[1] = 0;
    for(int i = 1; i < m; i++){
        int j = f[i];
        while(j && P[i] != P[j]) j = f[j];
        if(P[i] == P[j]) j++;
        f[i+1] = j;
    }
}

void KMP()
{
    int n = strlen(T), m = strlen(P);
    flag = 0;
    getf();//预处理
    int j = 0; //当前结点编号,起始点为0号结点
    for(int i = 0; i < n; i++){
        while(j && P[j] != T[i]) j = f[j];
        if(P[j] == T[i]) j++;
        if(j == m) { j = f[j]; flag++;}
    }
}

int main()
{
    int SUM;
    cin >> SUM;
    while(SUM--){
        scanf("%s", P);
        getchar();
        scanf("%s", T);
        KMP();
        printf("%d\n", flag);
    }
    return 0;
}





04-27
### KMP算法的实现 KMP算法的核心在于通过构建前缀表来减少不必要的字符比较,从而提高字符串匹配的效率。以下是其实现细节: #### 构建前缀表 前缀表记录了模式串中每个位置对应的最长相等前后缀长度。对于给定的模式串`pattern`,可以通过以下方式计算其前缀表。 ```python def compute_prefix_table(pattern): n = len(pattern) prefix_table = [0] * n # 初始化前缀表 j = 0 # 表示当前匹配到的位置 for i in range(1, n): # 遍历模式串 while j > 0 and pattern[i] != pattern[j]: j = prefix_table[j - 1] if pattern[i] == pattern[j]: j += 1 prefix_table[i] = j # 记录当前位置的最大公共前后缀长度 return prefix_table ``` 此部分实现了如何利用模式串自身的特性跳过不必要匹配的过程[^2]。 #### 字符串匹配过程 基于已构建好的前缀表,可以快速完成目标字符串与模式串之间的匹配操作。 ```python def kmp_search(text, pattern): m = len(pattern) n = len(text) prefix_table = compute_prefix_table(pattern) # 获取前缀表 matches = [] # 存储匹配起始索引的结果列表 j = 0 # 当前匹配到的模式串位置 for i in range(n): # 遍历文本串 while j > 0 and text[i] != pattern[j]: j = prefix_table[j - 1] if text[i] == pattern[j]: j += 1 if j == m: # 如果完全匹配,则记录结果 matches.append(i - m + 1) j = prefix_table[j - 1] # 继续寻找下一个可能的匹配点 return matches ``` 以上代码展示了完整的KMP算法逻辑及其执行流程[^3]。 --- ### KMP算法的应用 #### 文本编辑器中的查找功能 在现代文本编辑器中,当用户输入一段文字并希望查询某个子串是否存在时,通常会调用高效的字符串匹配算法。由于KMP算法的时间复杂度为O(m+n),其中m为目标文本长度,n为模式串长度,在处理大规模数据集时表现尤为突出[^1]。 例如,假设有一个大型文档文件需要频繁检索某些关键词,采用KMP算法能够显著提升性能。 #### 生物信息学领域 DNA序列分析是一个典型的例子,科学家们经常面对海量基因组数据,而这些数据本质上就是由字母A、C、G、T组成的超长字符串。因此,使用像KMP这样的高级字符串匹配技术可以帮助研究人员更加快捷地定位感兴趣的片段。 此外,在网络入侵检测系统(IDS)、反病毒软件等领域也广泛运用到了类似的原理来进行恶意代码签名扫描等工作。 ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值