1.串的模式匹配算法
子串的定位操作通常称为串的模式匹配,是各种串处理系统中最重要的操作之一。
最基本的算法就是暴力匹配法。
即从主串的第一个字符开始和子串第一个字符挨个比较。若中途匹配失败,则从主串的第二个字符开始和子串的第一个字符挨个比较。若匹配失败,则从主串的第三个字符开始和子串的第一个字符挨个比较。若匹配失败,……
下面的程序是从主串S的第pos个字符开始和子串T匹配。返回匹配成功后,子串在主串中的位置,若不存在则返回0。
int Index1(SString S, SString T, int pos)
{
int i, j = 1;
if (pos >= 1 && pos <= S[0]) {
i = pos;
while (i <= S[0] && j <= T[0]) {
if (S[i] == T[j]) {
++i;
++j;
}
else {
i = i - j + 2;
j = 1;
}
}
if (j == T[0] + 1)
return i - T[0];
else
return 0;
}
}
此算法的效率非常低,最坏的情况下,时间复杂度为O(n*m)。
比如子串为‘000000001’,主串为‘000000000000000000000000000000000000001’。
2.KMP算法
KMP算法的时间复杂度为O(n+m)。
例:(经典匹配步骤)
本质是:每次发现字符不匹配后,主串的 i 不需要回溯(第二次比较根本没必要,应该直接进行第三次比较),而是利用已经得到的部