KMP

字符串匹配:KMP,就是给出一个长串T,给出一个短串P,求T是否包含子串P,若包含,输出第一个子串的位置。否则输出-1。

首先假定i是T的指针,j是P的指针。
对于传统的匹配模式,每当T[i] != P[j]时,我们会把j变成0,i跳回到刚才匹配的起始位置的下一个位置重新进行匹配,这样复杂度是O(n*m).

但是对于KMP思想,可以先构造一个next数组,next[j] = k 表示,短串中的子串0 ~ j的串中,以P[j]结尾的后缀串,与该子串中以P[0]开头的前缀串重复时,k的位置。
即有P[0] ~ P[k] = P[j - k] ~ P[j].

这样,在匹配过程中当短串匹配到j,长串匹配到了i,然后下一个字符不匹配,那么其实P[0] ~ P[j] 是与 T[i - j] ~ T[i]是匹配的。那么,我们利用短串中后缀与前缀的关系,让下一次匹配的位置变成next[j].假设next[j] = k,那么其实短串中的P[0] ~ P[k]是已经与长串中的T[i - k] ~ T[k]是匹配过的了(一开始与后缀匹配成功了,而这个前缀和后缀是相同滴)。所以就这样匹配下去了。


//////////////////////////////////////
另外注意的是,得到的后缀和前缀的长度都是k,且这个k应该是最长的,能满足前缀和后缀相等的值。因为KMP匹配过程中,长串的指针j是不需要回溯的,所以我们要保证能利用到j前面那些匹配成功的字符。

如果不是k最长的反例:
假设长串aaaaaab
短串aaaaab
若令next[0] = next[5] = -1 ; next[1] ~ next[4] = 0;
则会发现返回的结果是匹配不成功。
(因为长串的指针不回溯,需要利用到前面那段匹配过的结果)
///////////////////////////////////////////

言归正传,KMP,下面是对于整型的情况(HDU 1711)

void get_next(int *p, int *next) //p是短串
{
int i = 1, j = 0;
next[0] = -1;
while (i < m) //m是短串长度
{
if (p[i] == p[j])
{
next[i] = j;
j++;

}
else
{
if (p[i] == p[0])
{
next[i] = 0;
j = 1;

}
else
{
next[i] = -1;
j = 0;
}
}
++i;
}
}
void kmp()
{
int i = 0, j = 0;
while (i < n) //n是长串长度
{
if (T[i] == P[j]) //P是短串,T是长串
{

if (j == m - 1)
{
printf("%d\n", i - j + 1);
break;
}
++i, ++j;
}
else
{
if (j == 0)
{
j = 0;
i++;
}
else j = nex[j - 1] + 1;
}
}
if (i == n) printf("-1\n");
}
10-19
### KMP算法详解 KMP(Knuth-Morris-Pratt)算法是一种高效的字符串匹配算法,用于在一个主串中快速找到模式串的位置。其核心思想在于通过预处理模式串构建部分匹配表(Partial Match Table, PMT),从而减少不必要的字符比较次数。 #### 部分匹配表的计算 部分匹配表记录了模式串前缀和后缀的最大重叠长度。具体来说,对于模式串 `P` 的每个位置 `i`,计算最长相等前后缀的长度并存入数组 `next[i]` 中[^1]。 以下是部分匹配表的构造方法: ```python def compute_next(pattern): n = len(pattern) next_array = [0] * n # 初始化 next 数组 j = 0 # 前缀指针 for i in range(1, n): # 后缀指针从第二个字符开始遍历 while j > 0 and pattern[j] != pattern[i]: j = next_array[j - 1] if pattern[j] == pattern[i]: j += 1 next_array[i] = j # 记录当前最大公共前后缀长度 return next_array ``` #### 字符串匹配过程 基于已构建的部分匹配表,可以高效完成字符串匹配操作。当遇到失配时,无需回退主串指针,而是依据部分匹配表调整模式串起始位置继续匹配。 下面是完整的 KMP 算法实现: ```python def kmp_search(text, pattern): m = len(text) n = len(pattern) next_array = compute_next(pattern) # 构建部分匹配表 matches = [] j = 0 # 模式串索引 for i in range(m): # 主串索引 while j > 0 and text[i] != pattern[j]: j = next_array[j - 1] if text[i] == pattern[j]: j += 1 if j == n: # 找到匹配子串 matches.append(i - n + 1) j = next_array[j - 1] # 继续寻找下一个可能的匹配 return matches ``` --- ### KMP算法在OFDM中的应用 正交频分复用(Orthogonal Frequency Division Multiplexing, OFDM)是一种广泛应用于现代通信系统的调制技术。它将信道划分为多个相互正交的子载波,在这些子载波上传输数据。为了提高传输效率和抗干扰能力,OFDM通常会引入同步机制以及训练序列来辅助接收端解码。 KMP算法可以在以下几个方面与OFDM相结合: #### 1. **训练序列检测** 在OFDM系统中,发送端会在帧头插入特定的训练序列以便于接收端进行同步和信道估计。由于训练序列具有固定的结构特征,因此可以通过KMP算法快速定位该序列在接收到的数据流中的位置[^2]。 例如,假设训练序列为 `"ABCD"`,而接收到的一段信号表示为一维采样值 `[..., A', B', C', D', ...]`,则可将其离散化后再运用KMP算法执行精确匹配。 #### 2. **符号边界识别** 除了训练序列外,某些标准还规定了特殊的标志位用来指示每一段有效负载的起点和终点。同样地,借助KMP算法能够迅速发现这些标记所在的具体时间戳,进而帮助解析后续的信息字段。 #### 3. **错误校验码验证** 一些高级纠错编码方案可能会附加冗余比特作为检错手段之一;如果采用固定形式的循环冗余检验 (CRC),那么也可以考虑利用类似的思路去加速查找对应的结果片段。 尽管如此,值得注意的是实际工程实践中往往更倾向于硬件电路或者专用指令集处理器来达成同样的目标,因为它们具备更高的实时性和更低功耗特性。 --- ### 总结 综上所述,虽然理论上存在多种方式让经典计算机科学理论融入无线通讯领域之中,但在真实场景下仍需综合考量性能指标等因素做出合理取舍。无论如何,深入理解基础原理始终有助于启发创新解决方案的设计灵感!
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值