Leetcode 10. 正则表达式匹配

本文介绍了一种基于动态规划的正则表达式匹配算法,该算法能够处理包含 '.' 和 '*' 的复杂正则表达式模式,并提供了详细的实现过程与示例。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

给定一个字符串 (s) 和一个字符模式 (p)。实现支持 '.' 和 '*' 的正则表达式匹配。

'.' 匹配任意单个字符。
'*' 匹配零个或多个前面的元素。

匹配应该覆盖整个字符串 (s) ,而不是部分字符串。

说明:

  • s 可能为空,且只包含从 a-z 的小写字母。
  • p 可能为空,且只包含从 a-z 的小写字母,以及字符 . 和 *

示例 1:

输入:
s = "aa"
p = "a"
输出: false
解释: "a" 无法匹配 "aa" 整个字符串。

示例 2:

输入:
s = "aa"
p = "a*"
输出: true
解释: '*' 代表可匹配零个或多个前面的元素, 即可以匹配 'a' 。因此, 重复 'a' 一次, 字符串可变为 "aa"。

示例 3:

输入:
s = "ab"
p = ".*"
输出: true
解释: ".*" 表示可匹配零个或多个('*')任意字符('.')。

示例 4:

输入:
s = "aab"
p = "c*a*b"
输出: true
解释: 'c' 可以不被重复, 'a' 可以被重复一次。因此可以匹配字符串 "aab"。

示例 5:

输入:
s = "mississippi"
p = "mis*is*p*."
输出: false

答主最初受编译原理课影响,不自觉得想用编译原理中得东西解决问题,理论上是可以解决,但效率没有dp快,且实现较为复杂。

注释部分为得到每个字符的可能后缀,未测试

 

解答如下(思路写在注释里了):

class Solution {
public:
    
//      //用邻接表存储后缀下标,用-1表示当前已经可以结束
//     map<int,vector<int>> preDeal(string p){
//         map<int,vector<int>> suffix;
//         for(int i=p.length()-1;i>=-1;i--){
//             if(p[i]!='*'){
//                 vector<int> sf;
//                 if(i+1>=p.length()){
//                     //当末尾为字母包含1表示可以结束
//                     sf.insert(sf.begin(),-1);
//                 }else {
//                     int gap=0;
//                     if(p[i+1]=='*'){
//                         //如a*,应当首先包含自身
//                         gap=1;
//                     }    
//                     //默认不出现形如a**类似意义的字符
//                     if(i+gap+1>=p.length()){
//                            //若a*后面为空,应当包含结束标志
//                         sf.insert(sf.begin(),-1);
//                     }else{
//                         if(i+gap+2<p.length()&&p[i+gap+2]=='*'){
//                                  //形如a*b*,当 b后的*存在时,b的后缀也是a的后缀
//                                 sf.insert(sf.end(),suffix[i+gap+1].begin(),suffix[i+gap+1].end());
//                             }else{
//                                 //形如a*bb,其后缀为a的后缀为a,及b本身
//                                 sf.insert(sf.end(),i+gap+1);
//                             }
//                         }
//                     //将循环自身放在最后,先尝试其他情况能否成功
//                     if(gap==1){
//                        sf.insert(sf.end(),i);
//                     }
//                     }
                
//                 //将后缀添加到邻接表中
//                 suffix[i]=sf;
//                 }
//             }
//            return suffix;
//         }
    
    bool isMatch(string s, string p) {
        bool ss[200][200];
        int i=s.length(),j=p.length();
        //都为空则为true
        ss[0][0]=true;
        //当s中不为空,p为空,一定匹配失败,false
        for(int x=1;x<=i;x++){
            ss[x][0]=false;
        }
        //s为空,满足a*c*的也可以为空,为空的取值为true
        for(int y=1;y<=j;y++){
            if(p[y-1]=='*')
                ss[0][y]=ss[0][y-2];
            else ss[0][y]=false;
        }
        for(int x=1;x<=i;x++)
            for(int y=1;y<=j;y++){
                //a*b,cb,  b相等,比较a*与c是否相等
                //a*b, c.   b与'.' 等同,比较a*与c是否相等
                if(p[y-1]=='.'||p[y-1]==s[x-1]){
                    ss[x][y]=ss[x-1][y-1];
                }else{
                   
                    if(p[y-1]=='*'){
                        //a,c*a*,只针对x,前者新来一个a,组成aa时,a==p[j-2],则看以前的内容a,c*a*,ss[x-1][y]
                        
                        //bc,acd,只针对y,后者新来一个*,组成acd*时,如果两者最后一个字符不相等,则能看acd是否匹配
                        //比较c与c,c与cd任意一个满足即可满足条件
                         if(p[y-2]==s[x-1]||p[y-2]=='.'){
                             //若相等的话,如baa,ba*,通过ss[x][y]=ss[x-1][y],将baa转化至b,
                             //再通过ss[x][y]=ss[x][y-2],将ba*转化为b与b进行比较
                             ss[x][y]=ss[x-1][y]||ss[x][y-2];
                         }else{
                              //bc,acd,后者新来一个*,组成acd*时,如果两者最后一个字符不相等,则只能看bc与ac是否匹配ss[x][y-2]
                             ss[x][y]=ss[x][y-2];   
                         }
                    }else{
                        //          针对x,y               来者不匹配 a!=p[j-2],ss[x][y]=false;
                        ss[x][y]=false;
                    }
                }
            }
        return ss[i][j];
    }
};

 

### 正则表达式匹配规则 正则表达式是一种用于描述字符串模式的语言,广泛应用于各种编程语言中。对于JavaJavaScript环境下HTML标签的匹配[^1]以及更通用的支持`.``*`元字符的正则表达式匹配问题[^2],遵循特定的语法结构。 #### 基础符号解释 - `.`:表示任何单一字符(除了换行符) - `*`:指示前一元素可以出现零次或多次 - `+`:意味着前一个字符至少要出现一次 - `?`:表明前一个字符是可选的,即可能出现也可能不出现 - `[abc]`:方括号内的任一字符都会被接受作为有效输入的一部分 - `(exp)`:圆括号用来分组表达式,影响优先级 针对带有特殊字符`.``*`的情况,在LeetCode10题中提到,当遇到星号时,它允许其前面的一个字符重复任意次数甚至不存在;而句点能够代表除换行外的任何一个字符。 ```python def isMatch(s, p): dp = [[False] * (len(p) + 1) for _ in range(len(s) + 1)] dp[-1][-1] = True for i in range(len(s), -1, -1): for j in range(len(p) - 1, -1, -1): first_match = i < len(s) and p[j] in {s[i], '.'} if j+1 < len(p) and p[j+1] == '*': dp[i][j] = dp[i][j+2] or first_match and dp[i+1][j] else: dp[i][j] = first_match and dp[i+1][j+1] return dp[0][0] ``` 这段Python代码实现了基于动态规划算法来判断给定字符串`s`是否能完全由模式串`p`所定义的规则进行匹配[^3]。这里的关键在于构建二维布尔型列表`dp[][]`,其中每一个位置记录着对应子序列之间的关系状态。 通过上述方式解决了复杂度较高的正则表达式匹配难题,并且有效地利用了记忆化技术减少了不必要的重复运算过程。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值