- 题意:让我们实现正则表达式的isMatching函数,判断包含正则表达式的p是否能匹配上字符串s。其中p只包含两种特殊字符。.和*,前者也可以匹配任意字符,后者可以重复前一个字符0~多次。
- 解法:
- 解法1,递归,分情况讨论
- s,p长度都为0,则返回true
- s长度不为0,p长度为0,则返回false
- s长度为0,p长度不为0,这种情况下只有p的格式是cc才可以匹配,否则都为false。
- 两者都不为0
- 如果p[1] != ‘*’, if s[0] == p[0],则判断s[1:] 和 p[1:],否则返回 false
- 如果p[1] == ‘*’, 这时候我们就要判断前一个字符需要重复多少次,我们从0次遍历到最大次数,每次都要判断一下s_new和p[2:]是否满足,注意,只要有一个满足,最后return的就是true。
- 代码如下:
bool isMatch1(string s, string p) {
// 主要思路是递归,判断第一个字符是否相等,如果相等继续比较下一个,否则返回false,终止条件是字符串长度为空
if(s.length() == 0 && p.length() == 0){
return true;
}
if(s.length() !=0 && p.length() == 0){
return false;
}
if(s.length() == 0 && p.length() != 0){
if(p.length() >= 2 && p[1] == '*'){
return isMatch(s, p.substr(2));
}
return false;
}
// 如果第二个字符不是*,则比较简单
if((p.length() > 1 && p[1] != '*') || p.length() == 1){
if(equal_char(s[0], p[0])){
return isMatch(s.substr(1), p.substr(1));
}else{
return false;
}
}
// 如果第二个字符是*
if(p.length() > 1 && p[1] == '*'){
while(s.length() > 0 && equal_char(s[0], p[0])){
// 循环次数加一,则*匹配的次数加一
// 之所以要在while循环里加isMatch是因为有时候匹配的个数取决于s和p,并不是简单的能匹配多少就匹配多少
// 比如说S='ABCC', P='.*C' 和 P='.*CC'都可以匹配成功
if(isMatch(s, p.substr(2))){
return true;
}
s = s.substr(1); //个数加1
}
// 不相等的话,直接跳过,当成0个
return isMatch(s, p.substr(2));
}
}
- 解法2: 动态规划。我们使用dp[i, j]表示s[0, i)和p[0, j)是否匹配。
- 如果p[j-1]不是*,则dp[i,j] = dp[i-1, j-1] && is_equal(s[i-1], p[j-1])
- 如果p[j-1]是*,
- 则dp[i, j] = dp[i, j-2] *表示重复0次
- 或dp[i, j] = dp[i-1, j] && is_equal(s[i-1], p[j-2) *表示重复1次或多次
- 代码如下:
bool isMatch(string s, string p) {
int m = s.length(), n = p.length();
vector<vector<bool> > dp(m + 1, vector<bool> (n + 1, false));
dp[0][0] = true;
for(int i=0;i<=m;i++){
for(int j=1;j<=n;j++){
if(p[j-1] != '*' && i>0){
dp[i][j] = dp[i-1][j-1] && equal_char(s[i-1], p[j-1]);
}
if(p[j-1] == '*'){
dp[i][j] = dp[i][j-2] || (i>0 && dp[i-1][j] && equal_char(s[i-1], p[j-2]));
}
}
}
return dp[m][n];
}