给定两个单词 word1 和 word2,计算出将 word1 转换成 word2 所使用的最少操作数 。
你可以对一个单词进行如下三种操作:
- 插入一个字符
- 删除一个字符
- 替换一个字符
示例 1:
输入: word1 = "horse", word2 = "ros"
输出: 3
解释:
horse -> rorse (将 'h' 替换为 'r')
rorse -> rose (删除 'r')
rose -> ros (删除 'e')
思路:
问题1:如果 word1[0..i-1] 到 word2[0..j-1] 的变换需要消耗 k 步,那 word1[0..i] 到 word2[0..j] 的变换需要几步呢?
答:先使用 k 步,把 word1[0..i-1] 变换到 word2[0..j-1],消耗 k 步。再把 word1[i] 改成 word2[j],就行了。如果 word1[i] == word2[j],什么也不用做,一共消耗 k 步,否则需要修改,一共消耗 k + 1 步。
问题2:如果 word1[0..i-1] 到 word2[0..j] 的变换需要消耗 k 步,那 word1[0..i] 到 word2[0..j] 的变换需要消耗几步呢?
答:先经过 k 步,把 word1[0..i-1] 变换到 word2[0..j],消耗掉 k 步,再把 word1[i] 删除,这样,word1[0..i] 就完全变成了 word2[0..j] 了。一共 k + 1 步。
问题3:如果 word1[0..i] 到 word2[0..j-1] 的变换需要消耗 k 步,那 word1[0..i] 到 word2[0..j] 的变换需要消耗几步呢?
答:先经过 k 步,把 word1[0..i] 变换成 word2[0..j-1],消耗掉 k 步,接下来,再插入一个字符 word2[j], word1[0..i] 就完全变成了 word2[0..j] 了。
从上面三个问题来看,word1[0..i] 变换成 word2[0..j] 主要有三种手段,用哪个消耗少,就用哪个。
def minDistance(self, word1: str, word2: str) -> int:
m, n = len(word1), len(word2)
# dp[i][j] 代表最小操作数(步骤),从 word1[0..i-1]转化为 word2[0..j-1].
# D[i][j] 表示 word1 的前 i 个字母和 word2 的前 j 个字母之间的编辑距离。
dp = [[0] * (m + 1) for _ in range(n + 1)]
# for _ in range(m + 1): dp[0][_] = _
# for _ in range(n + 1): dp[_][0] = _
# word2动,则是插入,word1从无到有
for a in range(m+1):dp[0][a]=a
# word1动,则是删除,word1从有到无
for b in range(n+1):dp[b][0]=b
for i in range(1, m + 1):
for j in range(1, n + 1):
if word1[i - 1] == word2[j - 1]:
dp[j][i] = dp[j - 1][i - 1]
else:
# dp[j - 1][i] word1插入
# dp[j][i - 1] word1删除
dp[j][i] = 1 + min(dp[j - 1][i], dp[j][i - 1], dp[j - 1][i - 1])
return dp[n][m]
#### @2
'''
动态规划
step1: 状态
首先只定义一维 DP[i] 不能有效简化问题的处理
使用 二维 DP[i][j],表示 word1 的 第i 个字母 与 word2 的 第 j 个字母 相同 需要的操作步骤数
将对 word1 处理 转化为 对 word1 和 word2 均处理
word1 插入一个字符 DP[i-1][j] + 1 -> DP[i][j]
word1 删除一个字符 = word2 插入一个字符 DP[i][j-1] + 1 -> DP[i][j]
word1 替换一个字符 = word1 word2 都替换一个字符 DP[i-1][j-1] + 1 -> DP[i][j]
step2: 动态方程
DP[i][j] A、 word1 的 i 个字母 与 word2 的 第 j 个字母 相同
DP[i][j] = DP[i-1][j-1] #不操作
B、不相同,需要进行 插入 删除 或者 替换操作
DP[i][j] = min(DP[i-1][j] + 1,DP[i][j-1] + 1,DP[i-1][j-1]+1)
'''
DP = [[0 for _ in range(len2+1)] for _ in range(len1+1)]
# 初始
for i in range(len1+1):
DP[i][0] = i
for j in range(len2+1):
DP[0][j] = j
for i in range(1,len1+1):
for j in range(1,len2+1):
if word1[i - 1] == word2[j - 1]:
DP[i][j] = DP[i-1][j-1]
else:
DP[i][j] = min(DP[i-1][j] + 1,DP[i][j-1] + 1,DP[i-1][j-1]+1)
return DP[len1][len2]
如果我想知道了 word2 的 第x字母在 word1 的第y个位置的最小修改数量
我们只要遍历这三种情况就可以等到结论了,
1. 修改他,dp[x-1][y-1]+x==y?0:1
*
2. 删除他 dp[x-1][y]+1 (x-1 匹配到y 删除 一个)
*
3. 添加他 dp[x][y-1]+1 (我的x位置匹配到y-1 然后再增加一个y)
参考:
https://leetcode-cn.com/problems/edit-distance/comments/
20190727
我们的目的是让问题简单化,比如说两个单词 horse 和 ros 计算他们之间的编辑距离 D,容易发现,如果把单词变短会让这个问题变得简单,很自然的想到用 D[n][m] 表示输入单词长度为 n 和 m 的编辑距离。
具体来说,D[i][j] 表示 word1 的前 i 个字母和 word2 的前 j 个字母之间的编辑距离。
当我们获得 D[i-1][j],D[i][j-1] 和 D[i-1][j-1] 的值之后就可以计算出 D[i][j]。
每次只可以往单个或者两个字符串中插入一个字符
那么递推公式很显然了
如果两个子串的最后一个字母相同,word1[i] = word2[i] 的情况下:
D[i][j] = 1 + min(D[i - 1][j], D[i][j - 1], D[i - 1][j - 1] - 1)
D[i][j]=1+min(D[i−1][j],D[i][j−1],D[i−1][j−1]−1)
否则,word1[i] != word2[i] 我们将考虑替换最后一个字符使得他们相同:
D[i][j] = 1 + min(D[i - 1][j], D[i][j - 1], D[i - 1][j - 1])
D[i][j]=1+min(D[i−1][j],D[i][j−1],D[i−1][j−1])
所以每一步结果都将基于上一步的计算结果,示意如下:
同时,对于边界情况,一个空串和一个非空串的编辑距离为 D[i][0] = i
和 D[0][j] = j
一些最近做到的动态规划?
【Leetcode_总结】139. 单词拆分 - python
以及可爱的小刘鸭?