LeetCode-Py 项目解析：字符串匹配之暴力匹配算法（Brute Force）-优快云博客

本文链接：https://blog.youkuaiyun.com/gitblog_00326/article/details/148465249

LeetCode-Py 项目解析：字符串匹配之暴力匹配算法（Brute Force）

LeetCode-Py ⛽️「算法通关手册」：超详细的「算法与数据结构」基础讲解教程，从零基础开始学习算法知识，800+ 道「LeetCode 题目」详细解析，200 道「大厂面试热门题目」。项目地址: https://gitcode.com/gh_mirrors/le/LeetCode-Py

1. 算法概述

暴力匹配算法（Brute Force），简称 BF 算法，是字符串匹配领域中最基础、最直观的算法。该算法以其简单直接的特性而闻名，虽然效率不高，但却是理解更高级字符串匹配算法的重要基础。

BF 算法的核心思想可以用一句话概括：逐个比较，不匹配就回退。具体来说，就是从文本串的第一个字符开始，依次与模式串的每个字符进行比较，如果全部匹配成功则返回位置；一旦发现不匹配，就将文本串的指针回退到上次匹配开始的下一个位置，模式串指针则回到开头重新开始匹配。

2. 算法原理详解

2.1 算法执行流程

让我们通过一个具体例子来理解 BF 算法的工作原理：

假设有：

文本串 T = "ABABCABABD"
模式串 p = "ABABD"

匹配过程如下：

第一轮匹配：
- 比较 T[0]和p[0]：A=A，匹配
- 比较 T[1]和p[1]：B=B，匹配
- 比较 T[2]和p[2]：A=A，匹配
- 比较 T[3]和p[3]：B=B，匹配
- 比较 T[4]和p[4]：C≠D，不匹配
- 回退：文本串指针回到1（上次开始的下一个位置），模式串回到0
第二轮匹配：
- 从T[1]和p[0]开始比较：B≠A，不匹配
- 回退：文本串指针前进到2，模式串回到0
第三轮匹配：
- T[2]=p[0]：A=A
- T[3]=p[1]：B=B
- T[4]=p[2]：C≠A，不匹配
- 回退：文本串指针前进到3，模式串回到0
第四轮匹配：
- T[3]=p[0]：B≠A
- 回退：文本串指针前进到4，模式串回到0
第五轮匹配：
- T[4]=p[0]：C≠A
- 回退：文本串指针前进到5，模式串回到0
第六轮匹配：
- T[5]=p[0]：A=A
- T[6]=p[1]：B=B
- T[7]=p[2]：A=A
- T[8]=p[3]：B=B
- T[9]=p[4]：D=D
- 完全匹配，返回位置5

2.2 算法特点

BF 算法有以下几个显著特点：

简单直观：算法逻辑非常直接，容易理解和实现
无需预处理：不像KMP等算法需要预先处理模式串
空间效率高：只需要常数级别的额外空间
时间效率低：最坏情况下时间复杂度较高

3. 算法实现解析

以下是 BF 算法的 Python 实现，我们逐行分析其工作原理：

def bruteForce(T: str, p: str) -> int:
    n, m = len(T), len(p)
    
    i, j = 0, 0                     # 初始化文本串和模式串的指针
    while i < n and j < m:          # 当两者都未到达末尾时继续
        if T[i] == p[j]:            # 当前字符匹配成功
            i += 1                  # 两者指针都前进
            j += 1
        else:
            i = i - (j - 1)         # 文本串回退到上次开始的下一个位置
            j = 0                   # 模式串回到开头

    if j == m:                      # 判断是否完全匹配
        return i - j                # 返回匹配起始位置
    else:
        return -1                   # 匹配失败返回-1

关键点说明：

i 和 j 分别跟踪文本串和模式串的当前位置
当字符匹配时，两个指针同时前进
当字符不匹配时：
- 文本串指针回退到 i - (j - 1)：这是上次匹配开始位置的下一个位置
- 模式串指针重置为0
循环结束后，检查是否完全匹配（j == m）

4. 算法复杂度分析

4.1 时间复杂度

BF 算法的时间复杂度分析需要考虑三种情况：

最佳情况：第一次匹配就成功
- 比较次数：m 次
- 时间复杂度：O(m)
最坏情况：每次都在模式串最后一个字符不匹配
- 比较次数：m × (n - m + 1) 次
- 时间复杂度：O(m×n)
- 示例：T="AAAAAAAB"，p="AAAB"
平均情况：
- 假设字符集大小为d，每个字符出现的概率相等
- 平均比较次数：约(n + m)/2
- 时间复杂度：O(n×m)