dp--72. 编辑距离/medium 理解度C

本文介绍了如何使用动态规划解决给定两个单词的编辑距离问题,通过定义状态、推导状态转移方程以及构建dp数组,详细展示了计算过程和一个复杂度最优的Java代码示例。

1、题目

给你两个单词 word1 和 word2请返回将 word1 转换成 word2 所使用的最少操作数  。

你可以对一个单词进行如下三种操作:

  • 插入一个字符
  • 删除一个字符
  • 替换一个字符

 

示例 1:

输入:word1 = "horse", word2 = "ros"
输出:3
解释:
horse -> rorse (将 'h' 替换为 'r')
rorse -> rose (删除 'r')
rose -> ros (删除 'e')

示例 2:

输入:word1 = "intention", word2 = "execution"
输出:5
解释:
intention -> inention (删除 't')
inention -> enention (将 'i' 替换为 'e')
enention -> exention (将 'n' 替换为 'x')
exention -> exection (将 'n' 替换为 'c')
exection -> execution (插入 'u')

 

提示:

  • 0 <= word1.length, word2.length <= 500
  • word1word2 由小写英文字母组成
Related Topics
  • 字符串
  • 动态规划

2、题目分析

动态规划的解决套路可分为 2 步,①基于问题能定义出状态,②状态间具备动态规划的三个特性

①基于问题定义出状态:(参考该文完成分析:dp–139. 单词拆分 https://blog.youkuaiyun.com/fujuacm/article/details/135408092)

②状态间具备动态规划的三个特性(参考该文完成分析:dp–139. 单词拆分 https://blog.youkuaiyun.com/fujuacm/article/details/135408092)

  1. 重复子问题且重复策略
    重复子问题:
  2. 最优子结构
    重复策略&最优子结构:
  3. 无后效性
    更前的状态不影响当前状态:
    后面的状态不影响当前状态:

3、解题步骤

这道题的前提是只操作串1,而不是串1、串2都被操作

dp五部曲
1.定状态:(思考是否满足动规的3个特性)
dp数组:dp[n + 1][M + 1];
下标的含义:i,j表示截止到A串的第i字符,及截止到B串的第j字符,两串的最小编辑距离

2.推方程:(分场景推导方程)
若 A[i - 1] == B[j - 1],dp[i][j] = dp[i - 1][j - 1]; (若A串第i个字符、B串第j个字符相等,则当前2串的最小编辑距离 = A、B串各不包含i、j字符的子串的最小编辑距离)
若 A[i - 1] != B[j - 1],dp[i][j] = max(dp[i][j - 1], dp[i - 1][j], dp[i - 1][j - 1]) + 1 (若A串第i个字符、B串第j个字符 不相等,此时① dp[i][j - 1]表示在i位置后面插入字符;② dp[i - 1][j]表示把第i位置上的字符删除;③ dp[i - 1][j - 1]表示把第i位置上的字符替换为B串第j位置的字符)

3.初始化
dp数组第0行、及第0列随着下标的迁移递增。①表示当串2为空串时,对串1一直删减,使得串1=串2;②表示当串1不为空,串1为空时,对串1一直插入字符,使得串1=串2.

4.遍历
由第2点的状态转移方程可知,本状态可由3个方向的状态转移而来:左、上、左上。故i从小到大、j从小到大

5.举例

4、复杂度最优解代码示例

    public int minDistance(String word1, String word2) {
        int m = word1.length();
        int n = word2.length();

        // 创建二维数组dp,用于存储编辑距离
        int[][] dp = new int[m + 1][n + 1];

        // 初始化边界条件
        // 初始化,踩坑,终止条件写成了i < m,此时dp最后一个位置未被成功初始化。后续遍历时,可以基于数组开辟的长度来考虑,若存在遍历逻辑,基本是遍历到数组结尾
        for (int i = 0; i <= m; i++) {
            // 当串2为空,串1不为空时,对串1一直做删减操作,使得串1=串2
            dp[i][0] = i;
        }
        for (int j = 0; j <= n; j++) {
            // 当串1为空,串2不为空时,对串1一直做插入操作,使得串1=串2
            dp[0][j] = j;
        }

        // 动态规划计算编辑距离
        for (int i = 1; i <= m; i++) {
            for (int j = 1; j <= n; j++) {
                if (word1.charAt(i - 1) == word2.charAt(j - 1)) {
                    // 如果两个字符相同,不需要操作,编辑距离与前一个状态相同
                    dp[i][j] = dp[i - 1][j - 1];
                } else {
                    // 否则,需要对当前字符进行插入、删除或替换操作,取最小操作数
                    // 备注:若 A[i - 1] != B[j - 1],dp[i][j] = max(dp[i][j - 1], dp[i - 1][j], dp[i - 1][j - 1]) + 1   (若A串第i个字符、B串第j个字符 不相等,此时① dp[i][j - 1]表示在i位置后面插入字符;② dp[i - 1][j]表示把第i位置上的字符删除;③ dp[i - 1][j - 1]表示把第i位置上的字符替换为B串第j位置的字符)
                    dp[i][j] = Math.min(Math.min(dp[i - 1][j - 1], dp[i][j - 1]), dp[i - 1][j]) + 1;
                }
            }
        }

        // 返回编辑距离
        return dp[m][n];
    }

5、抽象与扩展

通用动态规划的解法,见标题二

### 动态规划解决编辑距离问题 编辑距离问题是经典的动态规划问题之一,其目标是找到将一个字符串转换成另一个字符串所需的最少操作次数。这些操作通常包括插入、删除和替换字符。 #### 1. 动态规划的核心思想 动态规划的关键在于将大问题分解为子问题并存储中间结果以避免重复计算。对于编辑距离问题,可以通过定义状态 `dp[i][j]` 来表示将字符串 `word1[0:i]` 转换为字符串 `word2[0:j]` 所需的最小操作数[^4]。 #### 2. 状态转移方程 当处理到两个字符串中的某个字符时,存在三种可能的操作: - 如果当前字符相同,则无需额外操作: \[ dp[i][j] = dp[i-1][j-1],\quad 当 word1[i-1]=word2[j-1] \] - 如果当前字符不同,则需要考虑以下三种情况取最小值: - 插入操作:`dp[i][j-1] + 1` - 删除操作:`dp[i-1][j] + 1` - 替换操作:`dp[i-1][j-1] + 1` 因此,完整的状态转移方程可以写为: \[ dp[i][j] = \begin{cases} dp[i-1][j-1],& 若 word1[i-1]==word2[j-1]\\ min(dp[i-1][j]+1,\, dp[i][j-1]+1,\, dp[i-1][j-1]+1),& 否则 \end{cases} \] 此公式涵盖了所有的可能性,并确保每次都能得到最优解[^5]。 #### 3. 边界条件 为了初始化动态规划表,我们需要设定边界条件: - 将空串转为目标串所需步数等于目标串长:`dp[i][0] = i` - 将源串转为空串所需步数等于源串长:`dp[0][j] = j` #### 4. 实现代码 以下是基于上述理论的 Python 实现代码: ```python def minDistance(word1: str, word2: str) -> int: m, n = len(word1), len(word2) # 创建 DP 表格并初始化 dp = [[0] * (n + 1) for _ in range(m + 1)] # 初始化边界条件 for i in range(1, m + 1): dp[i][0] = i for j in range(1, n + 1): dp[0][j] = j # 填充表格 for i in range(1, m + 1): for j in range(1, n + 1): if word1[i - 1] == word2[j - 1]: dp[i][j] = dp[i - 1][j - 1] else: dp[i][j] = min( dp[i - 1][j] + 1, # 删除 dp[i][j - 1] + 1, # 插入 dp[i - 1][j - 1] + 1 # 替换 ) return dp[m][n] ``` 这段代码实现了动态规划求解编辑距离的过程,时间复杂为 O(m*n),其中 m 和 n 是输入字符串的长--- ### 复杂分析 - **时间复杂**: 需要填充整个二维数组,故时间为 \(O(m \times n)\)。 - **空间复杂**: 使用了一个大小为 `(m+1)*(n+1)` 的矩阵来保存所有子问题的结果,所以空间复杂也是 \(O(m \times n)\)[^4]。 如果仅关注最终结果而不需要记录路径,还可以优化空间复杂至线性级别。 ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值