dp--72. 编辑距离/medium 理解度C

原创已于 2024-04-25 17:20:51 修改 · 1.1k 阅读

16 ·

CC 4.0 BY-SA版权

文章标签：

#数据结构 #动态规划 #算法

于 2024-01-17 07:30:00 首次发布

算法解题报告-leetcode 热门专栏收录该内容

60 篇文章

订阅专栏

本文介绍了如何使用动态规划解决给定两个单词的编辑距离问题，通过定义状态、推导状态转移方程以及构建dp数组，详细展示了计算过程和一个复杂度最优的Java代码示例。

72. 编辑距离

1、题目
2、题目分析
3、解题步骤
4、复杂度最优解代码示例
5、抽象与扩展

1、题目

给你两个单词 word1 和 word2， 请返回将 word1 转换成 word2 所使用的最少操作数 。

你可以对一个单词进行如下三种操作：

插入一个字符
删除一个字符
替换一个字符

示例 1：

输入：word1 = "horse", word2 = "ros"
输出：3
解释：
horse -> rorse (将 'h' 替换为 'r')
rorse -> rose (删除 'r')
rose -> ros (删除 'e')

示例 2：

输入：word1 = "intention", word2 = "execution"
输出：5
解释：
intention -> inention (删除 't')
inention -> enention (将 'i' 替换为 'e')
enention -> exention (将 'n' 替换为 'x')
exention -> exection (将 'n' 替换为 'c')
exection -> execution (插入 'u')

提示：

0 <= word1.length, word2.length <= 500
word1 和 word2 由小写英文字母组成

2、题目分析

动态规划的解决套路可分为 2 步，①基于问题能定义出状态，②状态间具备动态规划的三个特性

①基于问题定义出状态：（参考该文完成分析：dp–139. 单词拆分 https://blog.youkuaiyun.com/fujuacm/article/details/135408092）

②状态间具备动态规划的三个特性（参考该文完成分析：dp–139. 单词拆分 https://blog.youkuaiyun.com/fujuacm/article/details/135408092）

重复子问题且重复策略
重复子问题：
最优子结构
重复策略&最优子结构：
无后效性
更前的状态不影响当前状态：
后面的状态不影响当前状态：

3、解题步骤

这道题的前提是只操作串1，而不是串1、串2都被操作

dp五部曲
1.定状态：（思考是否满足动规的3个特性）
dp数组：dp[n + 1][M + 1]；
下标的含义：i，j表示截止到A串的第i字符，及截止到B串的第j字符，两串的最小编辑距离

2.推方程：（分场景推导方程）
若 A[i - 1] == B[j - 1]，dp[i][j] = dp[i - 1][j - 1]; （若A串第i个字符、B串第j个字符相等，则当前2串的最小编辑距离 = A、B串各不包含i、j字符的子串的最小编辑距离）
若 A[i - 1] != B[j - 1]，dp[i][j] = max(dp[i][j - 1], dp[i - 1][j], dp[i - 1][j - 1]) + 1 （若A串第i个字符、B串第j个字符不相等，此时① dp[i][j - 1]表示在i位置后面插入字符；② dp[i - 1][j]表示把第i位置上的字符删除；③ dp[i - 1][j - 1]表示把第i位置上的字符替换为B串第j位置的字符）

3.初始化
dp数组第0行、及第0列随着下标的迁移递增。①表示当串2为空串时，对串1一直删减，使得串1=串2；②表示当串1不为空，串1为空时，对串1一直插入字符，使得串1=串2.

4.遍历
由第2点的状态转移方程可知，本状态可由3个方向的状态转移而来：左、上、左上。故i从小到大、j从小到大

5.举例

4、复杂度最优解代码示例

    public int minDistance(String word1, String word2) {
        int m = word1.length();
        int n = word2.length();

        // 创建二维数组dp，用于存储编辑距离
        int[][] dp = new int[m + 1][n + 1];

        // 初始化边界条件
        // 初始化，踩坑，终止条件写成了i < m，此时dp最后一个位置未被成功初始化。后续遍历时，可以基于数组开辟的长度来考虑，若存在遍历逻辑，基本是遍历到数组结尾
        for (int i = 0; i <= m; i++) {
            // 当串2为空，串1不为空时，对串1一直做删减操作，使得串1=串2
            dp[i][0] = i;
        }
        for (int j = 0; j <= n; j++) {
            // 当串1为空，串2不为空时，对串1一直做插入操作，使得串1=串2
            dp[0][j] = j;
        }

        // 动态规划计算编辑距离
        for (int i = 1; i <= m; i++) {
            for (int j = 1; j <= n; j++) {
                if (word1.charAt(i - 1) == word2.charAt(j - 1)) {
                    // 如果两个字符相同，不需要操作，编辑距离与前一个状态相同
                    dp[i][j] = dp[i - 1][j - 1];
                } else {
                    // 否则，需要对当前字符进行插入、删除或替换操作，取最小操作数
                    // 备注：若 A[i - 1] != B[j - 1]，dp[i][j] = max(dp[i][j - 1], dp[i - 1][j], dp[i - 1][j - 1]) + 1   （若A串第i个字符、B串第j个字符 不相等，此时① dp[i][j - 1]表示在i位置后面插入字符；② dp[i - 1][j]表示把第i位置上的字符删除；③ dp[i - 1][j - 1]表示把第i位置上的字符替换为B串第j位置的字符）
                    dp[i][j] = Math.min(Math.min(dp[i - 1][j - 1], dp[i][j - 1]), dp[i - 1][j]) + 1;
                }
            }
        }

        // 返回编辑距离
        return dp[m][n];
    }