Edit Distance
LeetCode上的72题:https://leetcode.com/problems/edit-distance/
文章目录
题目
给出两个单词word1和word2,找出将word1转成word2的操作的最小数目。
对单词的操作有:删除一个字母,增加一个字母,替换一个字母
Example1:
Input: word1 = "horse", word2 = "ros"
Output: 3
Explanation:
horse -> rorse (replace 'h' with 'r')
rorse -> rose (remove 'r')
rose -> ros (remove 'e')
Example2:
Input: word1 = "intention", word2 = "execution"
Output: 5
Explanation:
intention -> inention (remove 't')
inention -> enention (replace 'i' with 'e')
enention -> exention (replace 'n' with 'x')
exention -> exection (replace 'n' with 'c')
exection -> execution (insert 'u')
题解
求两个单词的编辑距离是一个动态规划问题,乍一看很难得到一个可行的算法,所以要考虑如何将问题转换成小问题。对于两个单词A[1,2,…,n], B[1,2,…m],令求解AB的编辑距离的问题为求E(n,m)的值。问题是如何将E(n,m)拆解成小问题。
考虑对单词AB的最后一个字母进行操作,若删除A[n],则E(n,m)=E(i,m) + 1,若A增加一个字母,那么增加的字母肯定是B[m],如果不是那么最终操作数量肯定大于或小于采用该操作的最终操作数量。此时E(n,m)=E(n,m-1)+1,相当于B删去了B[m]。如果将A[n]替换成B[m],亦或A[n]等于B[m],则E(n,m)=E(n-1,m-1)+diff(A[n],B[m]),若A[n],B[m]相等diff返回0,否则返回1。如此求E(n,m)就拆解成了三个子问题:求E(n-1,m),E(n,m-1),E(n-1,m-1)+diff(A[n],B[m])的最小值。最后确定问题的基准,我们容易得到E(0,0) = 0,E(0,i)=E(i,0)=i,这就是问题的基准。
由此问题的求解似乎可以用迭代来做,然而如果使用迭代,问题复杂度会成指数上升,因为迭代会造成重复计算,这与求斐波那契数列问题相似。
最终算法可以构造一个(n+1)*(m+1)的二维矩阵E,已知基准E(0,0) ~ E(0,m)和E(0,0) ~ E(n,0),求矩阵的其他位置的值,可以按照从左到右,从上到下的顺序求解。E(n,m)就是问题的解。
代码
class Solution {
public:
int minDistance(string word1, string word2) {
int matrix[word1.size() + 1][word2.size() + 1] = {0};
for (int i = 1; i < word1.size() + 1; i++) {
matrix[i][0] = i;
}
for (int i = 1; i < word2.size() + 1; i++) {
matrix[0][i] = i;
}
for (int i = 1; i < word1.size()+1; i++) {
for(int j = 1; j < word2.size()+1; j++) {
int diff = word1[i-1] == word2[j-1] ? 0 : 1;
matrix[i][j] = min(min(matrix[i-1][j], matrix[i][j-1])+1, matrix[i-1][j-1]+diff);
}
}
return matrix[word1.size()][word2.size()];
}
};
本文深入解析了LeetCode 72题“编辑距离”的算法实现,通过动态规划解决两字符串间的编辑距离问题,提供了详细的代码示例及算法思路。
7859

被折叠的 条评论
为什么被折叠?



