剑指offer()正则表达式匹配

本文深入解析了一个复杂的正则表达式匹配问题,通过详细的步骤和逻辑解释,阐述了如何处理包括'.‘和’*‘的模式匹配。文章涵盖了基本的匹配规则,以及如何处理特殊字符’*‘的各种情况,提供了完整的状态机匹配思路和代码实现。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

题目描述

请实现一个函数用来匹配包括’.‘和’ * ‘的正则表达式。模式中的字符 ‘.’ 表示任意一个字符,而’ * '表示它前面的字符可以出现任意次(包含0次)。 在本题中,匹配是指字符串的所有字符匹配整个模式。例如,字符串"aaa"与模式"a.a"和"abaca"匹配,但是与"aa.a"和"ab*a"均不匹配

分析

这题有点绕,理了有点久。
先不考虑"*",只考虑“.”:

如果字符串和模式串的当前字符相等,那么继续匹配它们的下一个字符;如果模式串中的字符是’.’,那么它可以匹配字符串中的任意字符,也可以继续匹配它们的下一个字符。

接下来,把字符’*'考虑进去,它可以匹配任意次的字符,当然出现0次也可以。
分两种情况来看:

1、模式串的下一个字符不是’*’,也就是上面说的只有字符’.'的情况。
如果字符串中的第一个字符和模式串中的第一个字符相匹配,那么字符串的模式串都向后移动一个字符,然后匹配剩余的字符串和模式串。如果字符串中的第一个字符和模式中的第一个字符不相匹配,则直接返回false。

2、模式串的下一个字符是’*’,此时就要复杂一些。
因为可能有多种不同的匹配方式。

选择一:无论字符串和模式串当前字符相不相等,我们都将模式串后移两个字符,相当于把模式串中的当前字符和’ * ‘忽略掉,因为’ * '可以匹配任意次的字符,所以出现0次也可以。

选择二:如果字符串和模式串当前字符相等,则字符串向后移动一个字符。而模式串此时有两个选择:

1、我们可以在模式串向后移动两个字符,继续匹配;

2、也可以保持模式串不变,这样相当于用字符’ * ‘继续匹配字符串,也就是模式串中的字符’ * '匹配字符串中的字符多个的情况。

用一张图表示如下:
在这里插入图片描述

如上图所示,当匹配进入状态2,并且字符串中的字符是’a’时,我们有两个选择:可以进入状态3(在模式串向后移动两个字符),也可以回到状态2(模式串保持不变)。

除此之外,还要注意对空指针的处理。

代码


class Solution {
public:
    bool match(char* str, char* pattern)
    {
        // 指针为空,返回false
        if(str == NULL || pattern == NULL){
            return false;
        }
        return matchCore(str, pattern);
    }
private:
    bool matchCore(char* str, char* pattern){
        // 字符串和模式串都运行到了结尾,返回true
        if(*str == '\0' && *pattern == '\0'){
            return true;
        }
        // 字符串没有到结尾,模式串到了,则返回false
        // 模式串没有到结尾,字符串到了,则根据后续判断进行,需要对'*'做处理
        if((*str != '\0' && *pattern == '\0')){
            return false;
        }
        // 如果模式串的下一个字符是'*',则进入状态机的匹配
        if(*(pattern + 1) == '*'){
            // 如果字符串和模式串相等,或者模式串是'.',并且字符串没有到结尾,则继续匹配
            if(*str == *pattern || (*pattern == '.' && *str != '\0')){
                // 往前移,进入下一个状态
                return matchCore(str + 1, pattern + 2) ||
                    // 保持当前状态,就是继续那这个'*'去匹配
                    matchCore(str + 1, pattern) ||
                    // 跳过'.'和'*'
                    matchCore(str, pattern + 2);
            }
            // 如果字符串和模式串不相等,则跳过当前模式串的字符和'*',进入新一轮的匹配
            else{
                // 跳过这个'*'
                return matchCore(str, pattern + 2);
            }
        }
        // 如果字符串和模式串相等,或者模式串是'.',并且字符串没有到结尾,则继续匹配
        if(*str == *pattern || (*pattern == '.' && *str != '\0')){
            return matchCore(str + 1, pattern + 1);
        }
        return false;
    }
};
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值