LeetCode Implement strStr() 暴力法, KMP法, Boyer-Moore简易版法

本文详细介绍了三种经典字符串查找算法:暴力法、简易版Boyer-Moore法及更新KMP法。通过代码实现与运行时间测试,对比分析了它们在效率与适用场景上的差异。

Implement strStr().

Returns a pointer to the first occurrence of needle in haystack, ornullif needle is not part of haystack.

经典的字符串查找问题了。这个问题其实有四种比较经典的算法,这里介绍2种半。因为这里的Boyer-Moore是简易版,全功率版应该是简易版加上KMP法的,那个实在是复杂,面试是不大可能写出来的,除非记熟了。

还有一种是Rabin-Karp fingerprint search,这个是利用hash函数产生所谓的fingerprint,然后对比子串的hash值和原串同样字符长的hash值是否一致,这个算法的关键是如何处理hash值。

下面的三种方法测试LeetCode的运行时间都差不多,大概是因为测试数据不大吧。

1 BF暴力法:

char *strStr(char *haystack, char *needle)
	{
		if (!haystack || !needle) return nullptr;
		int n = strlen(haystack);
		int m = strlen(needle);
		for (int i = 0; i <= n - m; i++)
		{
			int j = 0;
			for (; j < m; j++)
			{
				if (needle[j] != haystack[j+i]) break;
			}
			if (j == m) return haystack + i;
		}
		return nullptr;
	}


3 简易版Boyer Moore法

void bmSkipTable(char *ch, vector<int> &skipTable)
	{
		if (!ch) return;
		skipTable.resize(26);
		int m = strlen(ch);

		for (int i = 0; i < m; i++)
		{
			skipTable[ch[i] - 'a'] = i;
		}
	}
	char *bmStrStr(char *haystack, char *needle)
	{
		if(!haystack || !needle) return haystack;
		int n = strlen(haystack);
		int m = strlen(needle);

		vector<int> skipTable;
		bmSkipTable(needle, skipTable);

		int skip = 0;
		for (int i = 0; i <= n-m; i+=skip)
		{
			skip = 0;
			for (int j = m-1; j >= 0; j--)
			{
				if (haystack[i+j] != needle[j])
				{
					skip = j - skipTable[haystack[i+j] - 'a'];
					if (skip < 1) skip = 1;
					break;
				}
			}
			if (skip == 0) return haystack + i;
		}
		return nullptr;
	}


2 更新KMP法

//2014-2-20 update
	char *strStr(char *hay, char *ne)
	{
		int len = strlen(hay);
		int n = strlen(ne);
		vector<int> tbl = genTbl(ne, n);
		for (int i = 0, j = 0; i <= len - n; )//改成i<len那么会空串的时候出错
		{
			for ( ; j < len && j < n && hay[i+j] == ne[j]; j++);
			if (j == n) return hay+i;
			if (j > 0) 
			{
				i += j - tbl[j-1] - 1;
				j = tbl[j-1] + 1;
			}
			else i++;
		}
		return nullptr;
	}

	//修正bug
	vector<int> genTbl(char *ne, int n)
	{
		vector<int> tbl(n, -1);
		for (int i = 1, j = 0; i < n;)
		{
			if (ne[i] == ne[j])
			{
				tbl[i] = j;
				++j;
				++i;
			}
			else if (j > 0) j = tbl[j-1]+1;
			else i++;
		}
		return tbl;
	}


//2014-2-21 update Boyer-Moore Algorithm
	char *strStr(char *hay, char *ne)
	{
		int n = strlen(ne);
		if (n == 0) return hay;
		int len = strlen(hay);
		vector<int> tbl(256, -1);
		for (int i = 0; i < n; i++)
		{
			tbl[ne[i]] = i;
		}
		for (int i = n-1, j = n-1; i < len; )
		{
			for ( ; j >= 0 && hay[i] == ne[j]; j--, i--);
			if (j < 0) return hay + i + 1;
			if (tbl[hay[i]] < j) i += n - tbl[hay[i]] - 1;
			else i += n - j;
			j = n-1;
		}
		return nullptr;
	}




<think>嗯,用户想找Boyer-Moore投票算的流程图,还有图解。首先,我需要确认用户提到的Boyer-Moore投票算具体指的是哪个。因为Boyer-Moore通常有两种:一种是字符串匹配的Boyer-Moore,另一种是用于寻找多数元素的Boyer-Moore投票算。根据用户提供的引用,特别是引用[3],里面提到了Leetcode的多数元素问题,使用的方Boyer-Moore投票算,所以应该是指这个。接下来,我要确定用户的需求。他们需要流程图和图解,可能希望直观地理解算步骤。可能需要分步骤解释,并配合图示。需要先回顾这个算的工作原理。Boyer-Moore投票算通过维护一个候选元素和计数器,遍历数组,当计数器为0时更新候选,遇到相同元素计数器加一,否则减一。最后验证候选是否为多数元素。然后,考虑如何将这个过程转化为流程图。流程图通常包括开始、初始化、遍历元素、条件判断、更新计数器或候选、结束等步骤。同时,用户可能需要一个例子来图解算的执行过程,例如数组中的元素变化和计数器的变化情况。需要确保引用正确。引用[3]提供了该算的代码示例和随机化的方,但用户需要的是投票算,所以重点在引用[3]中的Boyer-Moore投票算部分。不过引用里提到的代码是随机化方,可能用户混淆了Boyer-Moore投票算和随机化方,需要澄清。正确的Boyer-Moore投票算应该是不需要随机化的,而是线性时间、常数空间的算,如LeetCode题解中的另一种方。可能用户混淆了两种算,需要确认正确的流程。例如,标准的Boyer-Moore投票算步骤是初始化候选和计数,遍历数组,比较元素与候选,根据计数是否为0更新候选,增减计数,最后验证。因此,流程图应该包括这些步骤。另外,用户提供的引用中,引用[3]的代码是随机化的,而正确的Boyer-Moore投票算代码可能不同,需要指出这一点,避免误导。需要解释清楚两者的区别,确保用户得到正确的信息。 最后,生成相关问题,帮助用户深入理解,比如算的正确性证明、与其他算的比较、时间复杂度和应用场景等。</think>### Boyer-Moore投票算流程图与图解 Boyer-Moore投票算是一种用于在$O(1)$空间复杂度和$O(n)$时间复杂度内寻找数组**多数元素**(出现次数超过$n/2$的元素)的高效算[^3]。其核心思想是通过**抵消计数**筛选候选元素。 #### 算流程图 ```mermaid graph TD A[开始] --> B[初始化候选值candidate和计数器count=0] B --> C[遍历数组元素] C --> D{当前元素是否等于candidate?} D ----> E[count += 1] D ----> F[count -= 1] E --> G{count是否为0?} F --> G G ----> H[更新candidate为当前元素, count=1] G ----> C C --> I[遍历结束] I --> J[验证candidate是否为多数元素] J --> K[结束] ``` #### 图解示例 以数组$[2,2,1,1,1,2,2]$为例: 1. **初始化**:$candidate=null, count=0$ 2. **遍历过程**: - 元素$2$:因$count=0$,设$candidate=2, count=1$ - 元素$2$:与$candidate$相同,$count=2$ - 元素$1$:与$candidate$不同,$count=1$ - 元素$1$:与$candidate$不同,$count=0$ - 元素$1$:因$count=0$,设$candidate=1, count=1$ - 元素$2$:与$candidate$不同,$count=0$ - 元素$2$:因$count=0$,设$candidate=2, count=1$ 3. **验证**:最终$candidate=2$,统计其出现次数(4次)是否超过$n/2$(3.5次)[^3]。 #### 注意事项 - **必须验证候选元素**:算假设存在多数元素,若不确定需遍历数组二次验证。 - **与字符串匹配算的区别**:Boyer-Moore投票算与字符串匹配中的Boyer-Moore(基于坏字符/好后缀规则[^2])无直接关联,仅为同名。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值