字符串的模式匹配

最新推荐文章于 2024-02-24 17:11:15 发布

原创最新推荐文章于 2024-02-24 17:11:15 发布 · 439 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

算法专栏收录该内容

2 篇文章

订阅专栏

本文详细介绍了两种模式匹配算法：朴素的模式匹配与KMP算法。朴素的模式匹配使用指针回溯的方式进行字符串匹配，时间复杂度较高。而KMP算法通过预处理模式串构建next数组，避免了主串指针的回溯，提高了匹配效率。

1、Naive的模式匹配

int NaiveIndex(char * Sstr,char * Tstr)

{

int i=0,j=0;

while(i<strlen(Sstr)&&j<strlen(Tstr))

{

if(Sstr[i]==Tstr[j])

{

i++;

j++;

}

else

{

i=i-j+1; //指针回溯

j=0;

}

}

if(j==strlen(Tstr))

return i-j;

else

return -1;

}

此方法最鲜明的特点就是指针回溯，时间复杂度为O(n*m)。

2、KMP算法

KMP算法中主串指针无须回溯，这是通过分析模式串中所蕴含的信息实现的。

从i=0，j=0看是，判断Sstr[i]==Tstr[j]是否相等

若相等，i++，j++，一直向下匹配；

若不相等，j=next[j],再重新判断Sstr[i]==Tstr[j]是否相等，直至匹配成功或主串遍历完毕

这里的next[j]就是根据模式串中蕴含的信息建立的数组。可以这样理解：在模式串位置j处之前的next[j]个字符与模式串开始的next[j]个字符是匹配的，但不是重叠的。

即模式串中索引值为0~next[j]-1之间的字符与主串中索引值为i-next[j]+1~i之间的字符是匹配的，接下来就要判断Sstr[i]==Tstr[j]是否相等(j=next[j])。

//next[]数组值的求解

void getNext(char *Tstr,int next[])

{

next[0]=-1;

int i=0,j=-1;

while(i<strlen(Tstr))

{

if(j==-1||Tstr[i]==Tstr[j])

{

i++;

j++;

next[i]=j;

}

else

j=next[j];

}

}

//KMPIndex函数

int KMPINdex(char * Sstr,char * Tstr)

{

int i=0,j=0;

int lenS=strlen(Sstr);

int lenT=strlen(Tstr);

while(i<lenS&&j<lenT-1)

{

if(j==-1||Sstr[i]==Sstr[j])

{

i++;

j++;

}

else

j=next[j];

}

if(j==lenS-1)

return i-j;

else

return -1;

}

主串中每个字符只与模式串中的一个字符比较，因此时间复杂度为O(m+n)。

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。