朴素字符串匹配与Karbin-Karp算法

本文介绍了两种字符串匹配方法:朴素字符串匹配方法与Rabin-Karp算法。朴素方法通过逐字符比较来寻找模式串在文本中的位置,时间复杂度为O(nm)。Rabin-Karp算法利用哈希函数减少不必要的比较,预处理时间为O(m),平均运行时间为O(n)。


     字符串的精度匹配就是在文本T中找出模式P的精确副本,并求出匹配的位置下标。即如果P[0...m-1]==T[k...k+m-1] ,则称P与T的子序列匹配成功。我们要找出所有匹配成功的k。

     朴素字符串匹配方法很简单。从文本T的第一个字母和模式P的第一个字母开始比较。如果不匹配,就从T的第二个字母开始匹配,依次类推,不保留所有有用得信息。设P和T的长度分别为m和n .这种算法有两层循环,没有预处理时间,算法时间复杂度为O(nm)。

void Naive_String_Match(string T, string P){
	int n,m,pos,i;
	n = T.size();
	m = P.size();
	pos = i = ans=0;
	while (pos <=n - m){
		i = 0;
		while (i < m&&P[i] == T[pos + i])
			i++;
		if (i == m)    //循环跳出时当 i==m就表示匹配成功
			postion[ans++] = pos;
		pos++;
	}
}

其中postion[]数组保存了匹配成功的 k 值。

另外一种改进的办法叫做Rabin-Karp算法。这个算法在实际应用中可以较好的运行。Rabin-karp算法预处理时间是O(m) .平均运行时间是O(n)(m<=n),在最坏情况下运行时间为O(mn) .首先在初等数论中有以下结论 :

    设 a,b,q为3个正整数,则有:

                         1)(a+b) mod q= (a%q+b%q)%q

                         2)a×b mod q =(a mod q)×(b mod q) mod q

设组成T和P的字符组成的集合是 A,例如A={'a','b'...'z'} .则A中字符的个数记为 |A| .算法的核心思想是将模式p通过一个hash函数映射为一个整数值 ,也将于p匹配的那部分T[pos...pos+m-1]映射为一个整数值,如果hash[p]!=hash[T]则他们一定不匹配,但是如果hash[T]==hash[p]则不一定匹配,这时候需要一个一个字母的比较。至于计算hash[p],我们可以通过霍纳法则来求,时间为O(m).

而对于hash[T]的值,我们需要开始计算出T[0...m-1]的值H(0),在计算H(t)时不需要重新计算,可以通过H(t-1)获得:

                         H(t)=((H(t-1)-T[pos])*|A|^m)*|A|+T[pos+m] )mod Prime;

这个式子使用的|A|进制,同时需要一个素数作为模运算。在一开始就可以把中间|A|^m计算出来,于是可以不用每次都计算|A|^m.具体代码如下,选择的是A={'a','b'...'z'},即26进制:

#include<iostream>
#include<string>
using namespace std;
#define p 82595483
void Match(string W, string T);
int postion[1001];
int ans;
int main(){
	int i;
	string W, T;
	cin >> W >> T;
	Match(W, T);
	for (i = 0; i < ans; i++)
		cout << postion[i] << endl;
	return 0;
}
void Match(string W, string T){
	int pos, n, m, i, t,h,d;
	n = T.size();
	m = W.size();
	h=t =pos=ans=0;
	d = 1;
	for (i = 0; i < m; i++){
		t = (t * 26 + W[i] - 'a') % p;      
		h = (h * 26 + T[i] - 'a') % p;
		d = (d * 26) % p;
	}
	while (pos <=n-m){
		if (h == t){
			i = 0; 
			while (i < m&&W[i] == T[i + pos])
				i++;
			if (i == m)
				postion[ans++]=pos;
		}
	    h = (26 * h - (T[pos] - 'a')*d + (T[pos + m]-'a')) % p;
		pos++;
	}
}


源码来自:https://pan.quark.cn/s/fdd21a41d74f 正方教务管理系统成绩推送 简介 使用本项目前: 早晨睡醒看一遍教务系统、上厕所看一遍教务系统、刷牙看一遍教务系统、洗脸看一遍教务系统、吃早餐看一遍教务系统、吃午饭看一遍教务系统、睡午觉前看一遍教务系统、午觉醒来看一遍教务系统、出门前看一遍教务系统、吃晚饭看一遍教务系统、洗澡看一遍教务系统、睡觉之前看一遍教务系统 使用本项目后: 成绩更新后自动发通知到微信 以节省您宝贵的时间 测试环境 正方教务管理系统 版本 V8.0、V9.0 如果你的教务系统页面下图所示的页面完全一致或几乎一致,则代表你可以使用本项目。 目前支持的功能 主要功能 每隔 30 分钟自动检测一次成绩是否有更新,若有更新,将通过微信推送及时通知用户。 相较于教务系统增加了哪些功能? 显示成绩提交时间,即成绩何时被录入教务系统。 显示成绩提交人姓名,即成绩由谁录入进教务系统。 成绩信息按时间降序排序,确保最新的成绩始终在最上方,提升用户查阅效率。 计算 计算百分制 对于没有分数仅有级别的成绩,例如”及格、良好、优秀“,可以强制显示数字分数。 显示未公布成绩的课程,即已选课但尚未出成绩的课程。 使用方法 Fork 本仓库 → 开启 工作流读写权限 → → → → → 添加 Secrets → → → → → → Name = Name,Secret = 例子 程序会自动填充 尾部的 ,因此你无需重复添加 对于部分教务系统,可能需要在 中添加 路径,如: 开启 Actions → → → 运行 程序 → → 若你的程序正常运行且未报错,那么在此之后,程序将会每隔 30 分钟自动检测一次成绩是否有更新 若你看不懂上述使用...
综合能源系统零碳优化调度研究(Matlab代码实现)内容概要:本文围绕“综合能源系统零碳优化调度研究”,提供了基于Matlab代码实现的完整解决方案,重点探讨了在高比例可再生能源接入背景下,如何通过优化调度实现零碳排放目标。文中涉及多种先进优化算法(如改进遗传算法、粒子群优化、ADMM等)在综合能源系统中的应用,涵盖风光场景生成、储能配置、需求响应、微电网协同调度等多个关键技术环节,并结合具体案例(如压缩空气储能、光热电站、P2G技术等)进行建模仿真分析,展示了从问题建模、算法设计到结果验证的全流程实现过程。; 适合人群:具备一定电力系统、能源系统或优化理论基础,熟悉Matlab/Simulink编程,从事新能源、智能电网、综合能源系统等相关领域研究的研究生、科研人员及工程技术人员。; 使用场景及目标:①开展综合能源系统低碳/零碳调度的科研建模算法开发;②复现高水平期刊(如SCI/EI)论文中的优化模型仿真结果;③学习如何将智能优化算法(如遗传算法、灰狼优化、ADMM等)应用于实际能源系统调度问题;④掌握Matlab在能源系统仿真优化中的典型应用方法。; 阅读建议:建议结合文中提供的Matlab代码网盘资源,边学习理论模型边动手调试程序,重点关注不同优化算法在调度模型中的实现细节参数设置,同时可扩展应用于自身研究课题中,提升科研效率模型精度。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值