字符串搜索算法

本文介绍了两种高效的字符串搜索算法:状态机算法与KMP算法。状态机算法通过构造搜索串的状态机来实现匹配,复杂度最高可达O(n+m^2)。KMP算法则通过记录匹配失败时的回退位置来提高效率,避免了不必要的回溯。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

strstr能在日常满足大部分的字符串搜索需求,但面对更高性能要求,其只能让位于新的算法,这些新的算法能将复杂度降为O(n)。

首先,介绍状态机算法。

这个算法的核心是构造一个搜索串的状态机,当输入逐个字符输入的时候,状态机运行。当状态机运行到最后一个状态的时候,也就是实现了一次匹配。此算法的核心是状态机的构造。构造复杂度最高为O(m^2)。所以此算法的复杂度最高为O(n+m^2)。


还有一种KMP算法,记录每个位置匹配失败时搜索串回退的位置。逐个字符进行匹配搜索时,若匹配失败,则将搜索串的指针回退,继续进行匹配搜索。


#include<iostream>
using namespace std;

const int m = 10;
int b[m+1] = { 0 };

void compute_prefix(char* s){
	b[1] = 0;
	int p = 0;
	for (int i = 2; i <= m; i++){
		while (p != 0 && s[i-1] != s[p]){
			p = b[p];
		}
		if (s[i-1] == s[p]){
			p++;
		}
		b[i] = p;
	}
}

void kmp(char *s, char *T){
	int n = strlen(T);
	int p = 0;
	for (int i = 1; i <= n; i++){
		while (p > 0 && T[i-1] != s[p]){
			p = b[p];
		}
		if (T[i-1] == s[p]){
			p++;
		}
		if (p == m){
			printf("%d\n", i);
			p = b[p];
		}
	}
}


void main(){
	char str[] = "ababababca";
	char T[] = "ababbababababcaca";
	compute_prefix(str);
	kmp(str, T);
}


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值