4.1 串的存储结构
4.1.1 定长顺序存储表示
#define MAXLEN 255 //预定义串的最大长度
typedef struct{
char ch[MAXLEN];
int length; //串的实际长度
}SSTRING;
length<=MAXLEN,超出的会被截断
4.1.2 堆分配存储表示
typedef struct{
char*ch;
int length;
}HString;
//heap allocation 采用动态内存分配存储
4.1.3 块链存储表示
指针所占用的字节数取决于计算机的地址总线宽度(即 CPU 的位数),与指针指向的数据类型无关。具体规则如下:
- 32 位系统:地址总线宽度为 32 位,指针需要存储 32 位(4 字节)的地址,因此指针占 4 字节。
- 64 位系统:地址总线宽度为 64 位,指针需要存储 64 位(8 字节)的地址,因此指针占 8 字节。
4.2 串的模式匹配
4.2.1 朴素模式匹配算法
时间复杂度:O(n*m)
4.2.2KMP算法
前缀(prefix)指字符串开头部分的连续字符序列,从左往右,长度是【1,length-1】
字符串
“hello”
的前缀包括“h”
、“he”
、“hel”
、“hell”,但不包括“hello”。
后缀(suffix)指字符串结尾部分的连续字符序列,从右往左,长度同样可以是1到字符串长度-1
字符串
“hello”
的后缀包括“o”
、“lo”
、“llo”
、“ello”
。单个字符串中,若前缀和后缀完全相同,则称为该字符串的 “公共前后缀”,其中最长的那个称为最长公共前后缀(Longest Prefix Suffix, LPS)
"abchabc"
LPS:"abc"
主串指针i永不回溯,字串指针可能回到开头(无公共前后缀情况下),说白了就是找模式串中的重复值。
得出next数组后程序其实是好写的,主串指针不动嘛,一写就出。
int KMP(SString S,SString T,int next[]){
int i=1,j=1;//主串指针和模式串指针
while(i<S.length&&j<T.length)
{
if(S.ch[i]==T.ch[j])
{++j;++i;}
else
{
j=next[i];
}
if(j>T.lentgh)
return i-T.length;//匹配成功范围模式串在主串中的位置
else
return 0;
}