字符串简称串,计算机的非数值处理的对象基本都是字符串对象。串是由零个或多个字符组成的有限序列。
串中任意个连续字符组成的子序列称为该串的子串,包含子串的串相应的称为主串。
某个字符在串中的序号称为串的该字符在串中的位置。子串在主串中的位置以子串的第一个字符在主串中的位置来表示。
当两个串的长度相等且每个对应位置的字符都相等时,称这两个串是相等的
由一个或多个空格组成的串称为空格串,其长度为串中空格字符的个数。
串的逻辑结构和线性表极为相似,区别仅在于串的数据对象限定为字符集。在基本操作上,串和线性表有很大差别。线性表的基本操作主要以单个元素作为操作对象,如查找,插入或删除某个元素等;而串的操作通常以子串作为操作对象,如查找,插入或删除一个子串等
实际上,在Java中有一个专门的String类用于对字符串的操作,而C语言中没有字符串类型,字符串是存放在字符型数组中的,将字符串作为字符数组来处理的。为了测定字符串的实际长度,C语言规定了一个“字符串结束标志”,以字符’\0’作为结束标志 。
串有三种存储方式
1.定长顺序存储表示与堆分配存储表示
//串的定长顺序存储表示
#define MAXLEN 255
typedef struct{
char ch[MAXLEN];//创建一个字符数组存储串,每个分量存储一个字符,类似顺序表的静态分配
int length;//串的长度
}SString;
//串的堆分配存储表示
typedef struct{
char *ch;//按串长动态分配存储区,ch指向串的基地址,类似顺序表的动态分配存储
int length;//串的长度
}HSString;
2.块链存储方式
串的基本操作有
StrAssign(&T,chars) 赋值操作
StrCopy(&T,S) 复制操作
StrEmpty(S) 判空操作
StrCompare(S,T) 比较操作
StrLength(S) 求串长
SubString(&Sub,S,pos,len) 求子串
Concat(&T,S1,S2) 串连接
Index(S,T) 定位操作
ClearString(&S) 清空操作
DestroyString(&S) 销毁串
串的模式匹配算法 子串的定位操作通常称为串的模式匹配,它求的是子串(常称模式串)在主串中的位置
暴力模式匹配算法(采用定长顺序存储)
从主串S的第一个字符开始,分别用计数指针i和j指示主串S和模式串T中当前正待比较的字符位置。从主串S的第一个字符起,与模式T的第一个字符比较,若相等,则继续逐个比较出后续字符,否则从主串的下一个字符起,重新和模式的字符比较;以此类推,直至模式T中的每一个字符依次和主串S中的一个连续的字符序列相等,则称匹配成功,函数值为与模式T中第一个字符相等的字符在主串S的序号,否则称匹配不成功,函数值为0
int Index(SString S,SString T){
int i=1,j=1;
while(i<S.length&&j<=T.length){//从主串S的第一个字符起,与模式T的第一个字符比较
if(S.ch[i]==T.ch[j]){
++i;++j;//继续比较后续字符
}
else{
i=i-j+2;j=1;//从主串的下一个字符起,重新和模式的字符比较
}
if(j>T.length) return i-T.length;//子串位置为与模式T中第一个字符相等的字符在主串S的序号
else return 0;
}
}
改进的模式匹配算法 KMP算法
如果已匹配相等的前缀序列中有某个后缀正好是模式的前缀,那么就可以将模式向后滑到与这些相等字符对齐的位置,主串i指针无需回溯,并继续从该位置开始进行比较。
我的理解是:在不匹配的那个字符之前的模式串中,找出最长公共前后缀且长度小于前面的模式串,将原本位于前缀的位置移动到后缀,next[j]就是第j个字符移动位数的函数
移动位数=已匹配的字符数-对应的部分匹配值
子串指针变化公式:(在子串的第j个字符与主串发生失配时,则跳到子串的next[j]位置重新与主串当前位置进行比较 )
//求next值
void get_next(String T,int next[1]){
int i=1,j=0;
next[1]=0;
while(i<T.length){
if(j==0||T.ch[i]==T.ch[j]){
++i;++j;
next[i]=j;//若pi=pj,则next[j+1]=next[j]+1
}
else j=next[j];//否则令j=next[j],循环继续
}
}
//KMP算法
int index_KMP(String S,String T,int next[]){
int i=1,j=1;
while(i<=S.length&&j<=T.length){
if(j==0||S.ch[i]=T.ch[j]){
++i;++j;//继续比较后续字符
}
else j=next[j];//模式串向右移动
}
if(j>T.length) return i-T.length;//匹配成功
else return 0;
}
//next数组修正值
void get_nextval(String T,int nextval[]){
int i=1;j=0;
nextval[1]=0;
while(i<T.length){
if(j==0||T.ch[i]==T.ch[j]){
++i;++j;
if(T.ch[i]!=T.ch[j])
nextval[i]=j;
}
else j=nextval[j];
}
}
KMP算法的详细解释及用法:优快云博客:KMP算法详解(超级详细)_JOU金牌码农的博客-优快云博客_kmp算法
b站视频:「天勤公开课」KMP算法易懂版_哔哩哔哩_bilibili
这一章的重点主要是KMP算法,串的结构也可以参考一下线性表