朴素字符串匹配与Karbin-Karp算法

本文介绍了两种字符串匹配方法:朴素字符串匹配方法与Rabin-Karp算法。朴素方法通过逐字符比较来寻找模式串在文本中的位置,时间复杂度为O(nm)。Rabin-Karp算法利用哈希函数减少不必要的比较,预处理时间为O(m),平均运行时间为O(n)。


     字符串的精度匹配就是在文本T中找出模式P的精确副本,并求出匹配的位置下标。即如果P[0...m-1]==T[k...k+m-1] ,则称P与T的子序列匹配成功。我们要找出所有匹配成功的k。

     朴素字符串匹配方法很简单。从文本T的第一个字母和模式P的第一个字母开始比较。如果不匹配,就从T的第二个字母开始匹配,依次类推,不保留所有有用得信息。设P和T的长度分别为m和n .这种算法有两层循环,没有预处理时间,算法时间复杂度为O(nm)。

void Naive_String_Match(string T, string P){
	int n,m,pos,i;
	n = T.size();
	m = P.size();
	pos = i = ans=0;
	while (pos <=n - m){
		i = 0;
		while (i < m&&P[i] == T[pos + i])
			i++;
		if (i == m)    //循环跳出时当 i==m就表示匹配成功
			postion[ans++] = pos;
		pos++;
	}
}

其中postion[]数组保存了匹配成功的 k 值。

另外一种改进的办法叫做Rabin-Karp算法。这个算法在实际应用中可以较好的运行。Rabin-karp算法预处理时间是O(m) .平均运行时间是O(n)(m<=n),在最坏情况下运行时间为O(mn) .首先在初等数论中有以下结论 :

    设 a,b,q为3个正整数,则有:

                         1)(a+b) mod q= (a%q+b%q)%q

                         2)a×b mod q =(a mod q)×(b mod q) mod q

设组成T和P的字符组成的集合是 A,例如A={'a','b'...'z'} .则A中字符的个数记为 |A| .算法的核心思想是将模式p通过一个hash函数映射为一个整数值 ,也将于p匹配的那部分T[pos...pos+m-1]映射为一个整数值,如果hash[p]!=hash[T]则他们一定不匹配,但是如果hash[T]==hash[p]则不一定匹配,这时候需要一个一个字母的比较。至于计算hash[p],我们可以通过霍纳法则来求,时间为O(m).

而对于hash[T]的值,我们需要开始计算出T[0...m-1]的值H(0),在计算H(t)时不需要重新计算,可以通过H(t-1)获得:

                         H(t)=((H(t-1)-T[pos])*|A|^m)*|A|+T[pos+m] )mod Prime;

这个式子使用的|A|进制,同时需要一个素数作为模运算。在一开始就可以把中间|A|^m计算出来,于是可以不用每次都计算|A|^m.具体代码如下,选择的是A={'a','b'...'z'},即26进制:

#include<iostream>
#include<string>
using namespace std;
#define p 82595483
void Match(string W, string T);
int postion[1001];
int ans;
int main(){
	int i;
	string W, T;
	cin >> W >> T;
	Match(W, T);
	for (i = 0; i < ans; i++)
		cout << postion[i] << endl;
	return 0;
}
void Match(string W, string T){
	int pos, n, m, i, t,h,d;
	n = T.size();
	m = W.size();
	h=t =pos=ans=0;
	d = 1;
	for (i = 0; i < m; i++){
		t = (t * 26 + W[i] - 'a') % p;      
		h = (h * 26 + T[i] - 'a') % p;
		d = (d * 26) % p;
	}
	while (pos <=n-m){
		if (h == t){
			i = 0; 
			while (i < m&&W[i] == T[i + pos])
				i++;
			if (i == m)
				postion[ans++]=pos;
		}
	    h = (26 * h - (T[pos] - 'a')*d + (T[pos + m]-'a')) % p;
		pos++;
	}
}


内容概要:本文详细介绍了一个基于C++的养老院管理系统的设计实现,旨在应对人口老龄化带来的管理挑战。系统通过整合住户档案、健康监测、护理计划、任务调度等核心功能,构建了从数据采集、清洗、AI风险预测到服务调度可视化的完整技术架构。采用C++高性能服务端结合消息队列、规则引擎和机器学习模型,实现了健康状态实时监控、智能任务分配、异常告警推送等功能,并解决了多源数据整合、权限安全、老旧硬件兼容等实际问题。系统支持模块化扩展流程自定义,提升了养老服务效率、医护协同水平和住户安全保障,同时为运营决策提供数据支持。文中还提供了关键模块的代码示例,如健康指数算法、任务调度器和日志记录组件。; 适合人群:具备C++编程基础,从事软件开发或系统设计工作1-3年的研发人员,尤其是关注智慧养老、医疗信息系统开发的技术人员。; 使用场景及目标:①学习如何在真实项目中应用C++构建高性能、可扩展的管理系统;②掌握多源数据整合、实时健康监控、任务调度权限控制等复杂业务的技术实现方案;③了解AI模型在养老场景中的落地方式及系统架构设计思路。; 阅读建议:此资源不仅包含系统架构模型描述,还附有核心代码片段,建议结合整体设计逻辑深入理解各模块之间的协同机制,并可通过重构或扩展代码来加深对系统工程实践的掌握。
内容概要:本文详细介绍了一个基于C++的城市交通流量数据可视化分析系统的设计实现。系统涵盖数据采集预处理、存储管理、分析建模、可视化展示、系统集成扩展以及数据安全隐私保护六大核心模块。通过多源异构数据融合、高效存储检索、实时处理分析、高交互性可视化界面及模块化架构设计,实现了对城市交通流量的实时监控、历史趋势分析智能决策支持。文中还提供了关键模块的C++代码示例,如数据采集、清洗、CSV读写、流量统计、异常检测及基于SFML的柱状图绘制,增强了系统的可实现性实用性。; 适合人群:具备C++编程基础,熟悉数据结构算法,有一定项目开发经验的高校学生、研究人员及从事智能交通系统开发的工程师;适合对大数据处理、可视化技术和智慧城市应用感兴趣的技术人员。; 使用场景及目标:①应用于城市交通管理部门,实现交通流量实时监测拥堵预警;②为市民出行提供路径优化建议;③支持交通政策制定信号灯配时优化;④作为智慧城市建设中的智能交通子系统,实现其他城市系统的数据协同。; 阅读建议:建议结合文中代码示例搭建开发环境进行实践,重点关注多线程数据采集、异常检测算法可视化实现细节;可进一步扩展机器学习模型用于流量预测,并集成真实交通数据源进行系统验证。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值