【数据结构C#】串

本文探讨了计算机中的字符串概念,包括串、子串、相等串的定义,以及C#和C语言中字符串的处理方式。重点介绍了串的存储方式和基本操作,如赋值、复制、比较等。特别地,文章深入讲解了KMP算法,一种高效的模式匹配方法,避免了不必要的回溯,通过计算部分匹配表实现快速定位,并给出了相关资源以便进一步学习。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

字符串简称串,计算机的非数值处理的对象基本都是字符串对象。串是由零个或多个字符组成的有限序列。

串中任意个连续字符组成的子序列称为该串的子串,包含子串的串相应的称为主串。

某个字符在串中的序号称为串的该字符在串中的位置。子串在主串中的位置以子串的第一个字符在主串中的位置来表示。

当两个串的长度相等且每个对应位置的字符都相等时,称这两个串是相等的

由一个或多个空格组成的串称为空格串,其长度为串中空格字符的个数。

串的逻辑结构和线性表极为相似,区别仅在于串的数据对象限定为字符集。在基本操作上,串和线性表有很大差别。线性表的基本操作主要以单个元素作为操作对象,如查找,插入或删除某个元素等;而串的操作通常以子串作为操作对象,如查找,插入或删除一个子串等

实际上,在Java中有一个专门的String类用于对字符串的操作,而C语言中没有字符串类型,字符串是存放在字符型数组中的,将字符串作为字符数组来处理的。为了测定字符串的实际长度,C语言规定了一个“字符串结束标志”,以字符’\0’作为结束标志 。

 

串有三种存储方式

1.定长顺序存储表示与堆分配存储表示

//串的定长顺序存储表示
#define MAXLEN 255
typedef struct{
	char ch[MAXLEN];//创建一个字符数组存储串,每个分量存储一个字符,类似顺序表的静态分配
	int length;//串的长度
}SString;

//串的堆分配存储表示
typedef struct{
	char *ch;//按串长动态分配存储区,ch指向串的基地址,类似顺序表的动态分配存储
	int length;//串的长度
}HSString;

2.块链存储方式

 

串的基本操作有

StrAssign(&T,chars) 赋值操作

StrCopy(&T,S) 复制操作

StrEmpty(S) 判空操作

StrCompare(S,T) 比较操作

StrLength(S) 求串长

SubString(&Sub,S,pos,len) 求子串

Concat(&T,S1,S2) 串连接

Index(S,T) 定位操作

ClearString(&S) 清空操作

DestroyString(&S) 销毁串 

 

串的模式匹配算法 子串的定位操作通常称为串的模式匹配,它求的是子串(常称模式串)在主串中的位置

暴力模式匹配算法(采用定长顺序存储) 

从主串S的第一个字符开始,分别用计数指针i和j指示主串S和模式串T中当前正待比较的字符位置。从主串S的第一个字符起,与模式T的第一个字符比较,若相等,则继续逐个比较出后续字符,否则从主串的下一个字符起,重新和模式的字符比较;以此类推,直至模式T中的每一个字符依次和主串S中的一个连续的字符序列相等,则称匹配成功,函数值为与模式T中第一个字符相等的字符在主串S的序号,否则称匹配不成功,函数值为0

int Index(SString S,SString T){
	int i=1,j=1;
	while(i<S.length&&j<=T.length){//从主串S的第一个字符起,与模式T的第一个字符比较
		if(S.ch[i]==T.ch[j]){
			++i;++j;//继续比较后续字符
		}
		else{
			i=i-j+2;j=1;//从主串的下一个字符起,重新和模式的字符比较
		}
		if(j>T.length) return i-T.length;//子串位置为与模式T中第一个字符相等的字符在主串S的序号
		else return 0;
	}
}

改进的模式匹配算法 KMP算法 

 如果已匹配相等的前缀序列中有某个后缀正好是模式的前缀,那么就可以将模式向后滑到与这些相等字符对齐的位置,主串i指针无需回溯,并继续从该位置开始进行比较。

我的理解是:在不匹配的那个字符之前的模式串中,找出最长公共前后缀且长度小于前面的模式串,将原本位于前缀的位置移动到后缀,next[j]就是第j个字符移动位数的函数

移动位数=已匹配的字符数-对应的部分匹配值

子串指针变化公式:(在子串的第j个字符与主串发生失配时,则跳到子串的next[j]位置重新与主串当前位置进行比较 )

//求next值
void get_next(String T,int next[1]){
	int i=1,j=0;
	next[1]=0;
	while(i<T.length){
		if(j==0||T.ch[i]==T.ch[j]){
			++i;++j;
			next[i]=j;//若pi=pj,则next[j+1]=next[j]+1
		}
		else j=next[j];//否则令j=next[j],循环继续
	}
}

//KMP算法
int index_KMP(String S,String T,int next[]){
	int i=1,j=1;
	while(i<=S.length&&j<=T.length){
		if(j==0||S.ch[i]=T.ch[j]){
			++i;++j;//继续比较后续字符
		}
		else j=next[j];//模式串向右移动
	}
	if(j>T.length) return i-T.length;//匹配成功
	else return 0;
}

//next数组修正值
void get_nextval(String T,int nextval[]){
	int i=1;j=0;
	nextval[1]=0;
	while(i<T.length){
		if(j==0||T.ch[i]==T.ch[j]){
			++i;++j;
			if(T.ch[i]!=T.ch[j]) 
			    nextval[i]=j;
		}
		else j=nextval[j];
	}
}

 

KMP算法的详细解释及用法:优快云博客:KMP算法详解(超级详细)_JOU金牌码农的博客-优快云博客_kmp算法 

b站视频:「天勤公开课」KMP算法易懂版_哔哩哔哩_bilibili

这一章的重点主要是KMP算法,串的结构也可以参考一下线性表

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

老坛酸菜吃鸭子

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值