[LeetCode]10.正则表达式匹配

本文探讨了使用动态规划方法解决正则表达式匹配问题,包括支持 '.' 和 '*' 的匹配规则。介绍了如何通过构建二维DP数组来判断字符串与模式是否完全匹配,并详细解释了状态转移方程。
题目:

给定一个字符串 (s) 和一个字符模式 (p)。实现支持 '.' 和 '*' 的正则表达式匹配。

'.' 匹配任意单个字符。
'*' 匹配零个或多个前面的元素。

匹配应该覆盖整个字符串 (s) ,而不是部分字符串。

思路:

读完题目后,

首先想到这是两个字符串间比较的题目,因为是在动态规划的标签下做的,所以第一时间想到了LCS的问题,十分类似。而事实上也是如此,个人感觉是十分类似的。

②接着想到了自动机的思想应该也是可以解决这个问题。(还木有写~)

③想到这两个想法后,最后首先尝试的确实十分作死的暴力,毕竟暴力是个十分简单而大部分时间有效的方法。

结局也是显而易见了,随着一连串的Wrong Answer后,放弃了这种做法。(这个题目需要思考的细节比较多,而且感觉做出来也是超时),于是开始思考第一种做法。

动态规划做法:

首先和LCS类似的声明一个数组,dp[i][j]:i表示源字符串s前i个字符构成的子串,j表示模式串p前j个字符构成的子串,因为本题中无论是源字符串s还是模式串p都可以为空,因此i=0和j=0是有意义的。dp[i][j]的值是true和false表示是否匹配成功。

比较s[i]和p[j]分为匹配成功和匹配不成功

①匹配成功,即当s[i]==p[j]||p[j]=='.',此时有 dp[i][j]=dp[i-1][j-1];

②匹配不成功

    当p[j]!='*'时,dp[i][j]=false;

    当p[j]=='*'时,

        s[i]!=p[j-1]时,有dp[i][j]=dp[i][j-2];

        s[i]==p[j-1]时,有dp[i][j]=dp[i-1][j-2]|dp[i][j-2]|dp[i-1][j]。

        对最后一个状态转移方程,思考下如下几个测试样例就可以明白。

        s:asdf     p:asdff*      s:asdf    p:ab*sdf     s:aaas    p:a*as

代码:

在编码的时候思路有些混乱,而且细节情况都是在提交错误后想到的,因此代码写的其丑无比,见谅!

class Solution {
public:
    bool isMatch(string s, string p) {
        int slen = s.length();
        int plen = p.length();
        vector<vector<int> > dp;
        bool flag;
        dp.resize(slen + 1, vector<int>(plen+1,0));
        dp[0][0]=1;
        int i,j;
        for(i=0;i<=slen;i++){
            for(j=0;j<=plen;j++){
                if(i==0&&j==0)continue;
                if(p[j-1]=='.'){
                    if(i!=0)
                        dp[i][j] = dp[i-1][j-1];
                    else
                        dp[i][j] = 0;

                }else if(s[i-1]==p[j-1]){
                    dp[i][j] = dp[i-1][j-1];
                }else if(p[j-1]=='*'){
                    if(s[i-1]!=p[j-2]&&p[j-2]!='.'){
                        dp[i][j]=dp[i][j-2];
                    }else{
                        if(p[j-2]=='.'&&i==0){
                            dp[i][j] = dp[i][j-2]|dp[i][j]|dp[i][j-2];
                        }
                        else
                            dp[i][j]=dp[i-1][j-2]|dp[i-1][j]|dp[i][j-2];
                    }
                }
            }
        }
        if(dp[i-1][j-1]==1) flag = true;
        else flag = false;
        return flag;
    }
};
### 正则表达式匹配规则 正则表达式是一种用于描述字符串模式的语言,广泛应用于各种编程语言中。对于Java和JavaScript环境下HTML标签的匹配[^1]以及更通用的支持`.`和`*`元字符的正则表达式匹配问题[^2],遵循特定的语法结构。 #### 基础符号解释 - `.`:表示任何单一字符(除了换行符) - `*`:指示前一元素可以出现零次或多次 - `+`:意味着前一个字符至少要出现一次 - `?`:表明前一个字符是可选的,即可能出现也可能不出现 - `[abc]`:方括号内的任一字符都会被接受作为有效输入的一部分 - `(exp)`:圆括号用来分组表达式,影响优先级 针对带有特殊字符`.`和`*`的情况,在LeetCode10题中提到,当遇到星号时,它允许其前面的一个字符重复任意次数甚至不存在;而句点能够代表除换行外的任何一个字符。 ```python def isMatch(s, p): dp = [[False] * (len(p) + 1) for _ in range(len(s) + 1)] dp[-1][-1] = True for i in range(len(s), -1, -1): for j in range(len(p) - 1, -1, -1): first_match = i < len(s) and p[j] in {s[i], '.'} if j+1 < len(p) and p[j+1] == '*': dp[i][j] = dp[i][j+2] or first_match and dp[i+1][j] else: dp[i][j] = first_match and dp[i+1][j+1] return dp[0][0] ``` 这段Python代码实现了基于动态规划算法来判断给定字符串`s`是否能完全由模式串`p`所定义的规则进行匹配[^3]。这里的关键在于构建二维布尔型列表`dp[][]`,其中每一个位置记录着对应子序列之间的关系状态。 通过上述方式解决了复杂度较高的正则表达式匹配难题,并且有效地利用了记忆化技术减少了不必要的重复运算过程。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值