正则表达式匹配

本文探讨了正则表达式匹配的算法思想,重点分析了两种大情况:当模式中当前字符不等于星号和等于星号时的匹配策略。通过递归判断,处理不同情况下的字符串和模式匹配可能性,例如跳过不匹配的字符或利用星号的灵活性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

题目和C++代码

/*请实现一个函数用来匹配包括'.'和'*'的正则表达式。模式中的字符'.'表示任意一个字符,
而'*'表示它前面的字符可以出现任意次(包含0次)。在本题中,匹配是指字符串的所有字符匹配整个模式。
例如,字符串"aaa"与模式"a.a"和"ab*ac*a"匹配,但是与"aa.a"和"ab*a"均不匹配*/
 bool match(char* str, char* pattern)
    {
        
   char *a=str;
    char *b=pattern;
    int len_a=strlen(a);
    int len_b=strlen(b);
    if(lenb==0) return len_a==0; //如果模式已经结束,str未结束肯定匹配失败
    bool flag=len_a>0&&(b[0]=='.'||(a[0]==b[0])); //判断a[0]和b[0]是否相等和str结束没
    if(len_b>1&&b[1]=='*'){ //patter[1]=*,落入第二种大情况
        return match(a,b+2)||(flag&&match(a+1,b));  //flag为0,则a+1不存在或a[0]不等于b[0]
        //则只存在第二种大情况的第一种小情况或者第二种大情况的第二种小情况的1号情况
        //flag=1,则存在第二种大情况的第二种小情况的1,2号情况,但是此时的1等于上面的1,不用重复写
    }else{
        return flag&&match(a+1,b+1); //pattern[1]不为*,落入第一种大情况
    }
    

算法思想

从*号的特殊性入手。后面将星号表示为•
第一种大情况:当前pattern[1]=不等于星号。

 如果现在str指针的第一个字符不等于pattern的第一个字符,那么要让模式能匹配,patter,后面必然要跟一个星号即pattern[1]=星号,能让str[0]跳过pattern[0]跟pattern[2]继续比较。所以,若pattern[1]不为星号,即patter[0]必然存在于模式,那么str[0]就不能等于模式集合的第一个字符。所以直接返回False。
 如果str[0]=pattern[0],那么str和pattern都移向下一个字符。str[0]=str[1],pattern[0]=pattern[1]。

第二种大情况:当前pattern[1]=星号。

 举个例子"bbc"、“abc”和"a•bc”,此时pattern[1]=星号。那么此时匹配的可能就又分四种。
第一种小情况
 对于"bbc"和"a•bc",str[0]!=pattern[0],由于patter[1]=星号,那么就可以让•起它的令前一个字符为0的效果,让str[0]跳过pattern[0]去和pattern[2]比较。
第二种小情况
 对于"abc”和"a•bc,str[0]=a=pattern[0]。那么此时的匹配方法又分三种,即可以让1.str[0]和pattern[2]去比较。2.或者让str[0]变为str[1],pattern不变再比较。3.再或者让str[0]变为str[1],pattern[0]变为pattern[2]比较。三种情况有一种匹配成功,都可以继续比较。此时注意到,3情况可由2的方法得到,同时1情况的变化等于第二种大情况的第一种小情况。这些特性有助于代码简化。

 由于每次下一种情况的处理的判断都是相同的,所以是递归判断。

牛客网链接

牛客网OJ链接.

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值