题目描述
Levenshtein 距离,又称编辑距离,指的是两个字符串之间,由一个转换成另一个所需的最少编辑操作次数。许可的编辑操作包括将一个字符替换成另一个字符,插入一个字符,删除一个字符。编辑距离的算法是首先由俄国科学家Levenshtein提出的,故又叫Levenshtein Distance。
Ex:
字符串A:abcdefg
字符串B: abcdef
通过增加或是删掉字符”g”的方式达到目的。这两种方案都需要一次操作。把这个操作所需要的次数定义为两个字符串的距离。要求:
给定任意两个字符串,写出一个算法计算它们的编辑距离。
请实现如下接口
/* 功能:计算两个字符串的距离
* 输入: 字符串A和字符串B
* 输出:无
* 返回:如果成功计算出字符串的距离,否则返回-1
*/
public static int calStringDistance (String charA, String charB)
{
return 0;
}输入描述:
输入两个字符串
输出描述:
得到计算结果
示例1
输入
abcdefg
abcdef
输出
1
实现代码
求解过程:
首先生成大小为(N+1)*(M+1)的矩阵dp. dp[x][y]表示A前x个字符串编辑成 B前y个字符所花费的代价.
对于第一行来说,dp[0][y]表示将一个空串变为B的前y个字符组成的子串,花费的代价为ic*y;
同理,对于第一列dp[x][0] = x*dc;
对于其他的位置,dp[x][y]可能有以下几种取值:
dp[x-1][y-1]+rc; //A[x-1]!=B[y-1] 将前x-1个字符变为B前y-1个字符,再将最后一个字符替换.
dp[x-1][y-1]; //A[x-1]==B[y-1] 将前x-1个字符变为B前y-1个字符,最后一个不用修改.
dp[x-1][y]+dc; //删除一个字符,将前x-1个字符变为B的前y个字符
dp[x][y-1]+ic; //将A前x-1个字符变为B的前y个字符,再插入一个字符
dp[x][y]的值就为以上四者最小的一个.
求解完毕,dp[n][m]即为所求.
package cn.c_shuang.demo50;
import java.util.Scanner;
/**
* 计算字符串的距离
* @author Cshuang
*
*/
public class Main {
public static void main(String[] args) {
Scanner in = new Scanner(System.in);
while(in.hasNext()){
String strA=in.nextLine();
String strB=in.nextLine();
int result = calStringDistance(strA,strB);
System.out.println(result);
}
in.close();
}
private static int calStringDistance(String strA, String strB) {
int n = strA.length();
int m = strB.length();
char[] sA = strA.toCharArray();
char[] sB = strB.toCharArray();
int[][] dis = new int[n+1][m+1];
if(n==0)
return m;
if(m==0)
return n;
for(int i=0;i<n+1;i++){
dis[i][0]=i;
}
for(int i=0;i<m+1;i++){
dis[0][i]=i;
}
for(int i=1;i<n+1;i++){
for(int j=1;j<m+1;j++){
if(sA[i-1]==sB[j-1])
dis[i][j]=dis[i-1][j-1];
else{
dis[i][j]=Math.min(dis[i-1][j]+1, Math.min(dis[i][j-1]+1, dis[i-1][j-1]+1));
}
}
}
return dis[n][m];
}
}