6-正则表达式匹配

该博客讨论了如何实现支持'.'和'*'的正则表达式匹配算法,通过动态规划解决匹配整个字符串的问题。文章通过示例解释了'.'和'*'的含义,并详细阐述了解决方案,包括不同情况下字符串和字符规律的匹配逻辑。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

题目

给你一个字符串 s 和一个字符规律 p,请你来实现一个支持 ‘.’ 和 ‘*’ 的正则表达式匹配。

  • ‘.’ 匹配任意单个字符
  • ‘*’ 匹配零个或多个前面的那一个元素
    所谓匹配,是要涵盖 整个 字符串 s的,而不是部分字符串。

示例 1:

输入:s = “aa” p = “a”
输出:false
解释:“a” 无法匹配 “aa” 整个字符串。

示例 2:

输入:s = “aa” p = “a*”
输出:true
解释:因为 ‘*’ 代表可以匹配零个或多个前面的那一个元素, 在这里前面的元素就是 ‘a’。因此,字符串 “aa” 可被视为 ‘a’ 重复了一次。

示例 3:

输入:s = “ab” p = “."
输出:true
解释:".
” 表示可匹配零个或多个(’*’)任意字符(’.’)。

示例 4:

输入:s = “aab” p = “cab”
输出:true
解释:因为 ‘*’ 表示零个或多个,这里 ‘c’ 为 0 个, ‘a’ 被重复一次。因此可以匹配字符串 “aab”。

示例 5:

输入:s = “mississippi” p = “misisp*.”
输出:false

题解

class Solution {
    public boolean isMatch(String s, String p) {
        int m=s.length();
        int n=p.length();
        boolean[][] dp=new boolean[m+1][n+1];//dp[i][j]代表第i个a和第j个b是否匹配
        dp[0][0]=true;
        for(int j=1;j<=n;j++){//a为空,b的匹配情况,遇*直接跨越
            if(p.charAt(j-1)=='*'){
                dp[0][j]=dp[0][j-2];
            }
        }
        for(int i=1;i<=m;i++){
            for(int j=1;j<=n;j++){
                if(p.charAt(j-1)=='*'){
                    if(p.charAt(j-2)=='.'||p.charAt(j-2)==s.charAt(i-1)){//有*时p前移两格匹配,s只要前移一格,注意:s移的是i!!
                        dp[i][j]=dp[i-1][j]||dp[i][j-2];
                    }else{
                        dp[i][j]=dp[i][j-2];
                    }
                }else{
                    if(p.charAt(j-1)==s.charAt(i-1)||p.charAt(j-1)=='.'){
                        dp[i][j]=dp[i-1][j-1];
                    }
                }
            }
        }
        return dp[m][n];
    }
}

思路:

  1. 以一个例子详解动态规划转移方程:
    S = abbbbc
    P = ab*d*c
    1. 当 i, j 指向的字符均为字母(或 '.' 可以看成一个特殊的字母)时,
       只需判断对应位置的字符即可,
       若相等,只需判断 i,j 之前的字符串是否匹配即可,转化为子问题 f[i-1][j-1].
       若不等,则当前的 i,j 肯定不能匹配,为 false.
       
           f[i-1][j-1]   i
                |        |
       S [a  b  b  b  b][c] 
       
       P [a  b  *  d  *][c]
                         |
                         j
       
    
    2. 如果当前 j 指向的字符为 '*',则不妨把类似 'a*', 'b*' 等的当成整体看待。
       看下面的例子
    
                i
                |
       S  a  b [b] b  b  c  
       
       P  a [b  *] d  *  c
                |
                j
       
       注意到当 'b*' 匹配完 'b' 之后,它仍然可以继续发挥作用。
       因此可以只把 i 前移一位,而不丢弃 'b*', 转化为子问题 f[i-1][j]:
       
             i
             | <--
       S  a [b] b  b  b  c  
       
       P  a [b  *] d  *  c
                |
                j
       
       另外,也可以选择让 'b*' 不再进行匹配,把 'b*' 丢弃。
       转化为子问题 f[i][j-2]:
    
                i
                |
       S  a  b [b] b  b  c  
        
       P [a] b  *  d  *  c
          |
          j <--
    
    3. 冗余的状态转移不会影响答案,
       因为当 j 指向 'b*' 中的 'b' 时, 这个状态对于答案是没有用的,
       原因参见评论区 稳中求胜 的解释, 当 j 指向 '*' 时,
       dp[i][j]只与dp[i][j-2]有关, 跳过了 dp[i][j-1].
    
  2. 归纳:
    如果 p.charAt(j) == s.charAt(i) : dp[i][j] = dp[i-1][j-1];
    如果 p.charAt(j) == '.' : dp[i][j] = dp[i-1][j-1];
    如果 p.charAt(j) == '*':
    	如果 p.charAt(j-1) != s.charAt(i) : dp[i][j] = dp[i][j-2] //in this case, a* only counts as empty
    	如果 p.charAt(i-1) == s.charAt(i) or p.charAt(i-1) == '.':
    	dp[i][j] = dp[i-1][j] //in this case, a* counts as multiple a
    	or dp[i][j] = dp[i][j-1] // in this case, a* counts as single a
    	or dp[i][j] = dp[i][j-2] // in this case, a* counts as empty
    
  3. 如果a串为空,b串不空,则看看是否有带*的情况,有的话就b前移两个

    如果ab都不空,则也分两种情况:如果b有xing*,则检查b的前一个字母和a是否相同,或者b前一个是不是.,两者满足一个都可以,dp就更新到或者跳过a的那个字母,或者跳过b的两个字母;如果b无xing*,则检查两个字符串的前一个字母是否相同,相同则前移。

  4. 之所以可以在j-1的循环里用j-2是因为*前面肯定是跟着别的字母的,*不会在最前面。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

codrab

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值