1.问题
给定一个源串和目标串,能够对源串进行以下操作:在任意位置上插入一个字符;替换任意字符;删除任意字符。
现要求写一个程序,实现返回最小操作次数,使得对源串进行上述这些操作后等于目标串(源串和目标串的长度都小于2000)。
该问题为字符串的编辑距离问题,解法与最长公共子序列(LSC)类似,故采用动态规划解决该问题。
2.解析
现假设 dis[i][j] 表示源串 s[0,1,…,s_len] 和目标串 t[0,1,…,t_len] 的最短编辑距离,其边界为 dis[0][j] = j 与 dis[i][0] = i 。
现对dis[i][j] 的计算进行分类讨论
①如果s[i] 不在t[0,1,…,t_len] 中,即s[i]在中间的某一次编辑操作中被删除了。因为删除操作没有前后相关性,故不妨将其在第一次操作中删除。除首次操作时删除外,后续编辑操作都是将长度为i-1的字符串编辑成长度为j的字符串,即dis[i-1][j] ,故dis[i][j] = dis[i-1][j] + 1;
②如果s[i] 在t[j]的位置,则要么s[i]=t[j] ,s[i]落在t[j]内(该编辑操作实际上是将长度为i-1的s’ 串,编辑成长度为j-1的t’ 串,即dis[i-1][j-1]);要么s[i]≠t[j],即s[i]在t[j]后面,此时需将s[i]修改为t[j], 故该情况需要在前面的基础上增加一次修改操作,即dis[i-1][j-1] + 1;
③如果s[i]在t[1,…,t_len-1]中