问题描述
给定 2 个字符串 a, b. 编辑距离是将 a 转换为 b 的最少操作次数,操作只允许如下 3 种:
插入一个字符,例如:fj -> fxj
删除一个字符,例如:fxj -> fj
替换一个字符,例如:jxj -> fyj
解题思路
用分治的思想解决比较简单,将复杂的问题分解成相似的子问题
假设字符串 a, 共 m 位,从 a[1] 到 a[m]
字符串 b, 共 n 位,从 b[1] 到 b[n]
d[i][j] 表示字符串 a[1]-a[i] 转换为 b[1]-b[j] 的编辑距离
那么有如下递归规律(a[i] 和 b[j] 分别是字符串 a 和 b 的最后一位):
当 a[i] 等于 b[j] 时,d[i][j] = d[i-1][j-1], 比如 fxy -> fay 的编辑距离等于 fx -> fa 的编辑距离
当 a[i] 不等于 b[j] 时,d[i][j] 等于如下 3 项的最小值:
d[i-1][j] + 1(删除 a[i]), 比如 fxy -> fab 的编辑距离 = fx -> fab 的编辑距离 + 1
d[i][j-1] + 1(插入 b[j]), 比如 fxy -> fab 的编辑距离 = fxyb -> fab 的编辑距离 + 1 = fxy -> fa 的编辑距离 + 1
d[i-1][j-1] + 1(将 a[i] 替换为 b[j]), 比如 fxy -> fab 的编辑距离 = fxb -> fab 的编辑距离 + 1 = fx -> fa 的编辑距离 + 1
递归边界:
a[i][0] = i, b 字符串为空,表示将 a[1]-a[i] 全部删除,所以编辑距离为 i
a[0][j] = j, a 字符串为空,表示 a 插入 b[1]-b[j],所以编辑距离为 j
class Solution:
@staticmethod
def minDistance( word1, word2):
"""
:type word1: str
:type word2: str
:rtype: int
本思路采用动态规划
"""
len_word1=len(word1)
len_word2=len(word2)
dp=[]
for row in range(len_word1+1):
this_tmp=[]
for col in range(len_word2+1):
if row==0:
this_tmp.append(col)
elif col==0:
this_tmp.append(row)
else:
this_tmp.append(False)
dp.append(this_tmp)
# print(dp)
for row in range(1,len_word1+1):
for col in range(1,len_word2+1):
if word1[row-1]==word2[col-1]:
dp[row][col]=dp[row-1][col-1]
else:
dp[row][col]=min(dp[row-1][col],dp[row-1][col-1],dp[row][col-1])+1
return dp[len_word1][len_word2]