子串的定位运算通常称为串的模式匹配或串匹配
应用于:搜索引擎,拼写检查,语言翻译,数据压缩等
串的模式匹配设有两个字符串S和T,设S为主串,也称为正文串;设T为子串,也称为模式。
在主串的S中查找与模式T中相匹配的子串,如果匹配成功,确定相匹配的子串的第一个字符在主串S中出现的位置。
BF算法
#include<stdio.h>
#include<malloc.h>
#include<stdlib.h>
typedef struct Arr
{
char *pBase;
int len;
int cnt;
}HString;
void init(HString *C,int length);//数组初始化
void append(HString *C,char val);//为数组中加入元素
void traverse(HString *C);//遍历输出
int Index_BF(HString *S,HString *T, int pos);//BF算法
int main(void)
{
HString S;//生成一个结构体变量S指向主串
HString T;//生成一个结构体变量T指向子串
init(&S,11);//生成一个空的主串
init(&T,7);//生成一个子串
//增加主串元素
append(&S,'c');
append(&S,'x');
append(&S,'s');
append(&S,'l');
append(&S,'o');
append(&S,'v');
append(&S,'e');
append(&S,'h');
append(&S,'m');
append(&S,'l');
//增加子串元素
append(&T,'s');
append(&T,'l');
append(&T,'o');
append(&T,'v');
append(&T,'e');
append(&T,'h');
printf("S数组元素为:\n");
traverse(&S);
printf("T数组元素为:\n");
traverse(&T);
int W = Index_BF(&S, &T, 3);//输出子串与主串匹配成功时在主串开始的位置
printf("%d\n",W);
return 0;
}
void init(HString *C,int length)
{
C->pBase = (char *)malloc(sizeof(int)*length);
if(NULL == C->pBase)
{
printf("动态内存分配失败!\n");
exit(-1);
}
C->len = length;
C->cnt = 0;
return;
}
void append(HString *C,char val)
{
C->pBase[C->cnt+1] = val;//生成数组的第一个为空,不增加元素
(C->cnt)++;
}
void traverse(HString *C)
{
int i;
for(i = 1; i<C->cnt+1; ++i)
{
printf("%c\n",C->pBase[i]);
}
}
int Index_BF(HString *S,HString *T, int pos)
{
int i = pos;//初始化
int j = 1;//初始化
while(i <= S->cnt && j <= T->cnt)//因为i,j是位于pBase[]中的,所以i,j应该小于等于有效长
度(cnt),和课本上的不一样。两个串均未比较到串尾
{
if(S->pBase[i] == T->pBase[j])//如果相等就继续比较后继字符
{
++i;
++j;
}
else//否则指针退回后重新开始匹配
{
i = i-j+2;//找几个数字运算以下就成,因为要到下一个字符,因此就是i的值增加1
j = 1;
}
}
if(j >T->cnt)
{
int m = i - T->cnt+1;//匹配成功
return m;
}
else
return 0;//匹配失败
}