字符串匹配 KMP 算法

//传统的字符串比较算法

#include <stdio.h>
#include <string.h>

char s[51],t[11];
int next[11];

int index(char *s,char *t,int pos)
{
 int i = pos;
 int j = 0;
 int len1 = strlen(s);
 int len2 = strlen(t);
 while(i<len1&&j<len2)
 {
  if(s[i]==t[j])
  {
   i++;
   j++;
  }
  else   //指针回溯
  {
   i=i-j+1;
   j=0;
  }
 }
 if(j>=len2)
  return i-len2;
}

int main()
{
 int pos;
 gets(s);
 gets(t);
 scanf("%d",&pos);

 int no = index(s,t,pos);
 if(no>0)
  printf("String s contains a substring t~~~\n");
 else
  printf("String s doesn't contain a substring t~~~\n");
 return 0;
}

//改进后的字符串比较算法

#include <stdio.h>
#include <string.h>

char s[51],t[11];
int next[11];

void get_next(char* t,int next[])
{
 int i = 1;
 int j = 0;
 next[0] = -1;
 while(i<strlen(t))
 {
  if(j==-1||t[i]==t[j])
  {
   i++;
   j++;
   next[i] = j;
  }
  else
  {
   j = next[j];
  }
 }
}

int index(char *s,char *t,int pos)
{
 int i = pos;
 int j = 0;
 int len1 = strlen(s);
 int len2 = strlen(t);
 while(i<len1&&j<len2)
 {
  if(j==-1||s[i]==t[j])//第一个字符都不匹配或者字符相等的情况
  {
   i++;
   j++;
  }
  else   //i指针不回溯,j指针
  {
   //i=i-j+1;
   j=next[j];
  }
 }
 if(j>=len2)
  return i-len2;
 else
  return -1;
}

int main()
{
 int pos;
 gets(s);
 gets(t);
 scanf("%d",&pos);
 get_next(t,next);
 int no = index(s,t,pos);
 if(no>0)
  printf("String s contains a substring t~~~\n");
 else
  printf("String s doesn't contain a substring t~~~\n");
 return 0;
}

//再次改进后的字符串比较算法

#include <stdio.h>
#include <string.h>

char s[51],t[11];
int next[11];

void get_nextval(char* t,int next[])
{
 int i = 1;
 int j = 0;
 next[0] = -1;
 while(i<strlen(t))
 {
  if(j==-1||t[i]==t[j])
  {
   i++;
   j++;
   if(t[i]!=t[j])
    next[i] = j;
   else
    next[i] = next[j];
  }
  else
  {
   j = next[j];
  }
 }
}

int index(char *s,char *t,int pos)
{
 int i = pos;
 int j = 0;
 int len1 = strlen(s);
 int len2 = strlen(t);
 while(i<len1&&j<len2)
 {
  if(j==-1||s[i]==t[j])//第一个字符都不匹配或者字符相等的情况
  {
   i++;
   j++;
  }
  else   //i指针不回溯,j指针
  {
   //i=i-j+1;
   j=next[j];
  }
 }
 if(j>=len2)
  return i-len2;
 else
  return -1;
}

int main()
{
 int pos;
 gets(s);
 gets(t);
 scanf("%d",&pos);
 get_nextval(t,next);
 int no = index(s,t,pos);
 if(no>0)
  printf("String s contains a substring t~~~\n");
 else
  printf("String s doesn't contain a substring t~~~\n");
 return 0;
}

### KMP字符串匹配算法的实现与原理 #### 原理概述 KMP算法的核心在于两个方面:部分匹配表(通常称为`next`数组)的构建以及如何利用这个表格来高效地完成字符串匹配[^1]。 #### 部分匹配表(next数组)的作用及其计算方式 为了提高查找效率,KMP引入了前缀函数的概念,即对于模式串P中的每一个位置i,next[i]代表的是从起始至第i位子串的最大相同真前缀和真后缀长度。当遇到不匹配情况时,可以根据此信息决定跳转到哪个位置继续尝试而不是盲目移动指针回到起点重新开始比较。具体来说,在初始化阶段就要先算好整个模式串对应的next值列表作为后续操作的基础依据[^3]。 #### 匹配流程描述 实际执行过程中,主串S和模式串P各自设有一个游标变量指向当前考察字符处。每当两者对应项一致,则同步前进一位;反之如果发现差异存在但又不是首次访问该节点的话(意味着已经有过至少一轮成功的局部对比),那么就依照预先准备好的next映射关系调整后者所指示的位置直至找到新的候选点或者确认完全失败为止。值得注意的是在整个扫描期间内针对源数据流里的任一成员都只会被检验过一次而已,因此整体性能得以保持在线性级别上运行[^5]。 ```python def compute_next(pattern): m = len(pattern) next_array = [-1] * m k = -1 for q in range(1, m): while k >= 0 and pattern[k + 1] != pattern[q]: k = next_array[k] if pattern[k + 1] == pattern[q]: k += 1 next_array[q] = k return next_array def kmp_search(text, pattern): n, m = len(text), len(pattern) if not text or not pattern or n < m: return -1 next_array = compute_next(pattern) i = j = 0 while i < n: if j == -1 or text[i] == pattern[j]: i += 1 j += 1 if j == m: return i - j else: j = next_array[j] return -1 if j != m else (i - j) if __name__ == "__main__": txt = "ABCDABC" pat = "BCD" index = kmp_search(txt, pat) print(f"Pattern found at index {index}" if index != -1 else "No match found.") ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值