题目描述
Levenshtein 距离,又称编辑距离,指的是两个字符串之间,由一个转换成另一个所需的最少编辑操作次数。许可的编辑操作包括将一个字符替换成另一个字符,插入一个字符,删除一个字符。编辑距离的算法是首先由俄国科学家Levenshtein提出的,故又叫Levenshtein Distance。
Ex:
字符串A:abcdefg
字符串B: abcdef
通过增加或是删掉字符”g”的方式达到目的。这两种方案都需要一次操作。把这个操作所需要的次数定义为两个字符串的距离。
要求:
给定任意两个字符串,写出一个算法计算它们的编辑距离。
请实现如下接口
/* 功能:计算两个字符串的距离
* 输入:字符串A和字符串B
* 输出:无
* 返回:如果成功计算出字符串的距离,否则返回-1
*/
输入描述:
输入两个字符串
输出描述:
得到计算结果
输入例子:
abcdefg abcdef
输出例子:
1
import java.util.Scanner;
public class Main {
public static void main(String[] args) {
Scanner scan = new Scanner(System.in);
while (scan.hasNext()) {
String str1 = scan.nextLine();
String str2 = scan.nextLine();
int distance = calStringDistance(str1, str2);
System.out.println(distance);
}//endwhile
scan.close();
}
/**
* 计算两个字符串的距离
* 删除、替换、插入距离都为1
* */
private static int calStringDistance(String str1 , String str2){
int n = str1.length();
int m = str2.length();
//创建二维数组保存编辑距离
//dp[i][j]代表将str1的前i个字符修改成str2的前j个字符的编辑距离
int[][] distance = new int[n + 1][m + 1];
//1、如果str1和str2都为空,编辑距离为0
distance[0][0] = 0;
//2、如果str1为空,str2不为空,str1修改成str2的前j个字符的编辑距离就是j;j次插入操作
for(int j = 1 ; j <= m; ++j){
distance[0][j] = j;
}
//3、如果str2为空,str1不为空,str1的前i个字符修改成str2的编辑距离就是i;i次删除操作
for(int i = 1 ; i <= n; ++i){
distance[i][0] = i;
}
//4、如果str1和str2都不为空
for(int i = 1 ; i <=n ; i++){
for(int j = 1; j <= m ; j++){
if(str1.charAt(i - 1) == str2.charAt(j - 1)){
//如果i和j位置的字符相同,编辑距离与 i-1修改成j-1相同
distance[i][j] = distance[i - 1][j - 1];
}else{
//如果i和j位置的字符不相同,编辑距离有三种情况
/* (1) i-1修改成j的编辑距离+1
* (2) i修改成j-1的编辑距离+1
* (3) i-1修改成j-1的编辑距离+1
* 取三者的最小值,得出前i个字符修改成前j个字符的最少编辑操作
* */
distance[i][j] = 1 + min(distance[i - 1][j] , distance[i][j - 1] , distance[i - 1][j - 1]);
}
}
}
return distance[n][m];
}
/**
* 求三个整数中的最小值
* */
private static int min(int i, int j, int k) {
int min = i;
if(min > j ){
min = j;
}
if(min > k){
min = k;
}
return min;
}
}
本文介绍了一种计算两个字符串之间的编辑距离的方法,即Levenshtein距离,并提供了一个具体的Java实现示例。通过构建二维数组来记录不同子串间的转换成本,从而找出最高效的编辑路径。

1546

被折叠的 条评论
为什么被折叠?



