返回所有匹配子串开始下标 KMP

该博客介绍了如何使用KMP算法解决在给定字符串s中找到与模式串p匹配的所有子串的起始下标的问题。通过KMP算法,可以有效地避免不必要的字符比较,提高搜索效率。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

题目:

给定一个字符串s和一个模式串p, 返回s中所有与p匹配的字符串开始下标

分析:

KMP算法, 解释看这里

package hello;

import java.util.ArrayList;
import java.util.List;

public class KMP {
	
	public static List<Integer> kmp(String s, String p){
		List<Integer> res = new ArrayList<Integer>();
		if(s == null || p == null || s.length()<p.length())
			return res;
		char[] sArr = s.toCharArray();
		char[] pArr = p.toCharArray();
		int[] next = getNext(p);
		int i=0, j=0;
		while(i<sArr.length){
			while(j<pArr.length){
				//加判断防止i溢出
				if(i>=sArr.length)
					break;
				//j为-1或匹配,则两数组往后遍历
				if(j==-1 || sArr[i]==pArr[j]){
					i++;
					j++;
				}else{
					//匹配失败,在next数组中找到应该移动到的位置
					j = next[j];
				}
			}
			if(j==pArr.length){
				res.add(i-j);
				j=0;
			}
		}
		
		return res;
		
	}
	//根据模式串计算next数组, next数组记录如果当前
### 使用KMP算法查找所有子串位置 为了实现使用KMP算法查找模式串`needle`在文本串`haystack`中的所有出现位置,可以基于已有的KMP匹配逻辑进行扩展。下面展示了一个完整的解决方案,该方案不仅能够返回第一个匹配的位置(如同某些简单版本),而且能找出所有的匹配起始索引。 #### 构造Next数组 构建`next`数组是KMP算法的关键部分之一。此数组用于存储模式串中各个位置的最大前后缀长度,这有助于跳过不必要的字符比较,提高效率[^2]。 ```cpp vector<int> build_next(const string& pattern) { vector<int> next(pattern.size()); int j = -1; next[0] = -1; for (int i = 1; i < pattern.size(); ++i) { while (j >= 0 && pattern[j + 1] != pattern[i]) j = next[j]; if (pattern[j + 1] == pattern[i]) ++j; next[i] = j; } return next; } ``` #### 查找所有匹配位置函数 接下来定义一个函数来执行实际的搜索工作,并收集每次成功匹配时对应的起点下标: ```cpp vector<int> findAllOccurrences(const string& text, const string& pattern) { auto next = build_next(pattern); vector<int> occurrences; int tLen = text.length(), pLen = pattern.length(); int ti = 0, pi = -1; while(ti < tLen){ // 当pi=-1或当前字符相等,则继续前进 if(pi==-1 || text[ti]==pattern[pi]){ ti++; pi++; } else{ // 否则根据next数组调整pi指针 pi = next[pi]; } // 如果完全匹配到了模式串,则记录当前位置并重置pi if(pi == pLen){ occurrences.push_back(ti-pLen); pi = next[pLen-1]; // 继续寻找下一个可能的匹配点 } } return occurrences; } ``` 这段代码实现了通过调用`findAllOccurrences()`方法传入目标字符串和要查找的子串作为参数,最终会获得一个整数列表表示每一个匹配开始的地方。如果没有任何地方匹配上给定的子串,则返回空列表[]。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值