算法导论学习笔记——32 字符串匹配

本文深入探讨了多种字符串匹配算法,包括朴素字符串匹配、Rabin-Karp算法、AC自动机、KMP算法等,详细解释了KMP算法的原理与实现,以及如何利用KMP算法计算最长回文子串。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

研究问题:
在这里插入图片描述
问目标串中能找出多少个模式串
解决方法与时间复杂度
在这里插入图片描述

32.1朴素字符串匹配

在这里插入图片描述
就是以目标串中的每个元素为起点进行匹配,当匹配到模式串尾部,匹配成功,不然从下个元素重新匹配

在这里插入图片描述

32.2Rabin-Karp 算法

在这里插入图片描述
主要思想,通过预处理模式串与目标串第1到i个数之和对某个数的模,然后快速筛掉无效匹配

32.3 ac自动机

还没学,以后再补

32.4 Knuth-Morris-Pratt

在这里插入图片描述
在这里插入图片描述
主要思想:
优化朴素的暴力匹配

为什么能优化暴力匹配?
举个例子:
目标串aaaaaaaaaaaaaaa,模式串aaaaaa
很容易观察到,模式串有大量相同的前后缀,
那么在用暴力匹配的方法去匹配的同时,
如果成功匹配了相同的后缀,那么下一次匹配就无需再从下一个字符开始重新匹配,而是可以从相同的前后缀的后一个字符开始匹配,从而节省时间
在这里插入图片描述
那么究竟要跳过多少个字符呢?
定义一个数组nex[i],存储前i-1个元素里前缀与后缀匹配的最大值,即跳过的字符数
通过动态规划的方式,预处理出nex[i]
在这里插入图片描述
例子
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

vector<int>nex,ans;//nex[i]是前i-1个元素里前缀与后缀匹配的最大值
//ans存匹配成功的下标
string text,pattern;//pattern模式串,text目标串,在text中找pattern
void build(string pattern)
{
    int n=pattern.size();
    nex.resize(n+1);
    for(int i=0,j=nex[0]=-1;i<n;nex[++i]=++j)
        while(j!=-1&&pattern[j]!=pattern[i])
            j=nex[j];
}

然后就是匹配了

void match(string text,string pattern)
{
    ans.clear();
    int n=pattern.size(),m=text.size();
    build(pattern);
    for(int i=0,j=0;i<m;i++)
    {
        while(j>0&&text[i]!=pattern[j]) j=nex[j];
        if(text[i]==pattern[j]) j++;
        if(j==n) ans.push_back(i-n+1),j=nex[j];
    }
}

其他应用:
计算最长回文子串
题目链接:
设目标字符串长度为n
将目标字符串复制一份并反转,
合成新字符串s+#+s反,
利用上面的预处理,
计算出前后缀相同的nex[i]数组
nex[n]即为答案。

#include <bits/stdc++.h>
using namespace std;
typedef long long ll;
typedef pair<long long,long long> pll;
template<class T>inline void rd(T &x){x=0;char o,f=1;while(o=getchar(),o<48)if(o==45)f=-f;do x=(x<<3)+(x<<1)+(o^48);while(o=getchar(),o>47);x*=f;}
const int inf=~0u>>2; 
const ll INF=~0ull>>2;
const int maxn=200000+10;
vector<int>nex;
int build(string pattern)
{
    int n=pattern.size();
    nex.resize(n+1);
    for(int i=0,j=nex[0]=-1;i<n;nex[++i]=++j)
        while(~j&&pattern[j]!=pattern[i])
            j=nex[j];
    return nex[n];
}
void solve()
{
	string s,t; cin>>s; int l=0,r=s.size()-1;
    while(s[l]==s[r]&&l<r) l++,r--;
    string t1=s.substr(0,l),t2=s.substr(r+1);
    s=s.substr(l,r-l+1); t=s; reverse(t.begin(),t.end());
    string a=s+'*'+t,b=t+'*'+s;
    string p=a.substr(0,build(a));
    string q=b.substr(0,build(b));
    cout<<t1<<(p.size()>q.size()?p:q)<<t2<<endl;
}
int main()
{
	#ifndef ONLINE_JUDGE
	freopen("hzh.in","r",stdin);
	//freopen("hzh.out","w",stdout);
	#endif
	ll T;
    rd(T);
    while(T--)
		solve();
    return 0;
}

补充:其它字符串匹配解法
1.马拉车(manacher)
2.哈希
3.PAM聚类算法

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值