6-正则表达式匹配

最新推荐文章于 2022-10-28 11:29:43 发布

原创最新推荐文章于 2022-10-28 11:29:43 发布 · 311 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#动态规划 #java #算法 #字符串 #leetcode

leetcode刷题练习同时被 2 个专栏收录

67 篇文章

订阅专栏

hot100

57 篇文章

订阅专栏

该博客讨论了如何实现支持'.'和'*'的正则表达式匹配算法，通过动态规划解决匹配整个字符串的问题。文章通过示例解释了'.'和'*'的含义，并详细阐述了解决方案，包括不同情况下字符串和字符规律的匹配逻辑。

题目

给你一个字符串 s 和一个字符规律 p，请你来实现一个支持 ‘.’ 和 ‘*’ 的正则表达式匹配。

‘.’ 匹配任意单个字符
‘*’ 匹配零个或多个前面的那一个元素
所谓匹配，是要涵盖整个字符串 s的，而不是部分字符串。

示例 1：

输入：s = “aa” p = “a”
输出：false
解释：“a” 无法匹配 “aa” 整个字符串。

示例 2:

输入：s = “aa” p = “a*”
输出：true
解释：因为 ‘*’ 代表可以匹配零个或多个前面的那一个元素, 在这里前面的元素就是 ‘a’。因此，字符串 “aa” 可被视为 ‘a’ 重复了一次。

示例 3：

输入：s = “ab” p = “."
输出：true
解释：".” 表示可匹配零个或多个（’*’）任意字符（’.’）。

示例 4：

输入：s = “aab” p = “cab”
输出：true
解释：因为 ‘*’ 表示零个或多个，这里 ‘c’ 为 0 个, ‘a’ 被重复一次。因此可以匹配字符串 “aab”。

示例 5：

输入：s = “mississippi” p = “misisp*.”
输出：false

题解

class Solution {
    public boolean isMatch(String s, String p) {
        int m=s.length();
        int n=p.length();
        boolean[][] dp=new boolean[m+1][n+1];//dp[i][j]代表第i个a和第j个b是否匹配
        dp[0][0]=true;
        for(int j=1;j<=n;j++){//a为空，b的匹配情况,遇*直接跨越
            if(p.charAt(j-1)=='*'){
                dp[0][j]=dp[0][j-2];
            }
        }
        for(int i=1;i<=m;i++){
            for(int j=1;j<=n;j++){
                if(p.charAt(j-1)=='*'){
                    if(p.charAt(j-2)=='.'||p.charAt(j-2)==s.charAt(i-1)){//有*时p前移两格匹配，s只要前移一格，注意：s移的是i！！
                        dp[i][j]=dp[i-1][j]||dp[i][j-2];
                    }else{
                        dp[i][j]=dp[i][j-2];
                    }
                }else{
                    if(p.charAt(j-1)==s.charAt(i-1)||p.charAt(j-1)=='.'){
                        dp[i][j]=dp[i-1][j-1];
                    }
                }
            }
        }
        return dp[m][n];
    }
}

思路：

以一个例子详解动态规划转移方程：
S = abbbbc
P = ab*d*c
1. 当 i, j 指向的字符均为字母（或 '.' 可以看成一个特殊的字母）时，
   只需判断对应位置的字符即可，
   若相等，只需判断 i,j 之前的字符串是否匹配即可，转化为子问题 f[i-1][j-1].
   若不等，则当前的 i,j 肯定不能匹配，为 false.
   
       f[i-1][j-1]   i
            |        |
   S [a  b  b  b  b][c] 
   
   P [a  b  *  d  *][c]
                     |
                     j
   

2. 如果当前 j 指向的字符为 '*'，则不妨把类似 'a*', 'b*' 等的当成整体看待。
   看下面的例子

            i
            |
   S  a  b [b] b  b  c  
   
   P  a [b  *] d  *  c
            |
            j
   
   注意到当 'b*' 匹配完 'b' 之后，它仍然可以继续发挥作用。
   因此可以只把 i 前移一位，而不丢弃 'b*', 转化为子问题 f[i-1][j]:
   
         i
         | <--
   S  a [b] b  b  b  c  
   
   P  a [b  *] d  *  c
            |
            j
   
   另外，也可以选择让 'b*' 不再进行匹配，把 'b*' 丢弃。
   转化为子问题 f[i][j-2]:

            i
            |
   S  a  b [b] b  b  c  
    
   P [a] b  *  d  *  c
      |
      j <--

3. 冗余的状态转移不会影响答案，
   因为当 j 指向 'b*' 中的 'b' 时, 这个状态对于答案是没有用的,
   原因参见评论区 稳中求胜 的解释, 当 j 指向 '*' 时,
   dp[i][j]只与dp[i][j-2]有关, 跳过了 dp[i][j-1].

归纳：
如果 p.charAt(j) == s.charAt(i) : dp[i][j] = dp[i-1][j-1]；
如果 p.charAt(j) == '.' : dp[i][j] = dp[i-1][j-1]；
如果 p.charAt(j) == '*'：
	如果 p.charAt(j-1) != s.charAt(i) : dp[i][j] = dp[i][j-2] //in this case, a* only counts as empty
	如果 p.charAt(i-1) == s.charAt(i) or p.charAt(i-1) == '.'：
	dp[i][j] = dp[i-1][j] //in this case, a* counts as multiple a
	or dp[i][j] = dp[i][j-1] // in this case, a* counts as single a
	or dp[i][j] = dp[i][j-2] // in this case, a* counts as empty

如果a串为空，b串不空，则看看是否有带*的情况，有的话就b前移两个

如果ab都不空，则也分两种情况：如果b有xing*，则检查b的前一个字母和a是否相同，或者b前一个是不是.,两者满足一个都可以，dp就更新到或者跳过a的那个字母，或者跳过b的两个字母；如果b无xing*，则检查两个字符串的前一个字母是否相同，相同则前移。
之所以可以在j-1的循环里用j-2是因为*前面肯定是跟着别的字母的，*不会在最前面。