52 计算字符串的距离/79计算字符串相似度

本文详细介绍了Levenshtein距离,又称编辑距离的概念,它是衡量两个字符串相似度的一种方法,通过计算由一个字符串转换成另一个字符串所需的最少编辑操作次数来定义。文章提供了动态规划算法实现,并附带代码示例,帮助读者理解和应用这一算法。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

题目描述
Levenshtein 距离,又称编辑距离,指的是两个字符串之间,由一个转换成另一个所需的最少编辑操作次数。许可的编辑操作包括将一个字符替换成另一个字符,插入一个字符,删除一个字符。编辑距离的算法是首先由俄国科学家Levenshtein提出的,故又叫Levenshtein Distance。
Ex:
字符串A:abcdefg
字符串B: abcdef

通过增加或是删掉字符”g”的方式达到目的。这两种方案都需要一次操作。把这个操作所需要的次数定义为两个字符串的距离。

要求:
给定任意两个字符串,写出一个算法计算它们的编辑距离。
请实现如下接口

/* 功能:计算两个字符串的距离

  • 输入: 字符串A和字符串B

  • 输出:无

  • 返回:如果成功计算出字符串的距离,否则返回-1

*/

 public   static   int  calStringDistance (String charA, String  charB)

{

    return  0;

}  

输入描述:
输入两个字符串
输出描述:
得到计算结果
示例1
输入
abcdefg
abcdef
输出
1
动态规划优化编辑器问题https://blog.youkuaiyun.com/shizheng163/article/details/50988023
思路:
* 字符串之间的距离,编辑距离,将strA编辑成strB所需的最小代价
* 编辑操作包括插入一个字符、删除一个字符、替换一个字符
* 分别对应的代价是ic、dc、rc,insert cost、delete cost、replace cost
* strA[x-1]代表strA的第x个字符,注意下标是从0开始的,strA[y-1]代表strA的第y个字符
* 定义一个代价矩阵为(N+1)*(M+1),M N 表示strA strB的长度
* dp[x][y]表示strA的前x个字符串编辑成 strB的前y个字符所花费的代价
* dp[x][y]是下面几种值的最小值:
* 1、dp[x][y] = dp[x-1][y] + dc
* dp[x-1][y]将strA的前x-1个字符编辑成strB的前y个字符的代价已知,
* 那么将将strA的前x个字符编辑成strB的前y个字符的代价dp[x][y]就是dp[x-1][y] + dc
* 相当于strA的前x-1个字符编辑成strB的前y个字符,现在变成了strA的前x个字符,增加了一个字符,要加上删除代价
* 2、dp[x][y] = dp[x][y-1] + ic
* dp[x][y-1]将strA的前x个字符编辑成strB的前y-1个字符的代价已知,
* 现在变为strB的前y个字符,相应的在strA前x个操作代价的基础上插入一个字符
* 3、dp[x][y] = dp[x-1][y-1]
* dp[x-1][y-1]将strA的前x-1个字符编辑成strB的前y-1个字符的代价已知,
* strA的第x个字符和strB的第y个字符相同,strA[x-1] == strB[y-1],没有引入操作
* 4、dp[x][y] = dp[x-1][y-1] + rc
* strA的第x个字符和strB的第y个字符不相同,strA[x-1] != strB[y-1],
* 在strA的前x-1个字符编辑成strB的前y-1个字符的代价已知的情况下,
* 计算在strA的前x字符编辑成strB的前y个字符的代价需要加上替换一个字符的代价

定义数组长度为实际字符串长度+1
最后一个为
dp[len1][len2]表示将str1的前len1个字符串转换成str2的前len2个字符串所需的操作
而str1的前len1个字符串,最后一个索引为str1[len1-1]
所以
dp[i][j]时判断str[i-1]与str2[j-1]表示判断前i个到前j个转换,但索引为[i-1]和[j-1]

def editdistance(string1,string2):
    len1,len2=len(string1)+1,len(string2)+1
    dp=[[0 for j in range(len2)]for i in range(len1)] #len1*len2
    ic,dc,rc=1,1,1
    for j in range(len2):
        dp[0][j]=j*ic #由A的0变为B的j个
    for i in range(len1):
        dp[i][0]=i*dc #由A的i个变为B的0个
    for i in range(1,len1):#从1开始1-m,1-n
        for j in range(1,len2):
            cost1=dp[i][j-1]+ic
            cost2=dp[i-1][j]+rc
            cost3 = dp[i - 1][j - 1]
            if string1[i-1]!=string2[j-1]:#string1的i-1个和string2的i-1个
                cost3=dp[i-1][j-1]+rc
            dp[i][j]=min(cost1,cost2,cost3)
    return dp[-1][-1]#返回最后一个
while True:
    try:
        print(editdistance(input(), input()))
    except:
        break
def Distance(str1,str2):
    len1,len2=len(str1)+1,len(str2)+1
    dp=[[0 for j in range(len2)] for i in range(len1)]#len1*len2个
    for i in range(len1):
        dp[i][0]=i
    for j in range(len2):
        dp[0][j]=j
    for i in range(1,len1):
        for j in range(1,len2):
            if str1[i-1]==str2[j-1]:#判断的相当于当前字符串
                dp[i][j]=dp[i-1][j-1]#如果等于,则dp[i][j]=dp[i-1][j-1]
            else:
                dp[i][j]=min(dp[i][j-1]+1,dp[i-1][j]+1,dp[i-1][j-1]+1)
    return dp[-1][-1]


while True:
    try:
        print(Distance(input(), input()))
    except:
        break
while True:
    try:
        string1=input()
        string2=input()
        distanceresult=Distance(string1,string2)
        similar='1/'+str(Distance(string1,string2)+1)
        print(similar)
    except:
        break
import java.util.*;
public class Main{
    public static void main(String[] args){
        Scanner in=new Scanner(System.in);
        while(in.hasNext()){
            String str1=in.nextLine();
            String str2=in.nextLine();
            System.out.println(calStringDistance(str1,str2));
        }
    }
    public static int calStringDistance(String charA,String charB){
        int len1=charA.length();
        int len2=charB.length();
        int[][] dp=new int[len1+1][len2+1];
        for(int i=0;i<=len1;i++)
            dp[i][0]=i;
        for(int j=0;j<=len2;j++)
            dp[0][j]=j;
        for(int i=1;i<=len1;i++){
            for(int j=1;j<=len2;j++){
                if(charA.charAt(i-1)==charB.charAt(j-1))//比较索引为i-1,j-1;实际是比较将前i个转为前j个(i和j从1计数)
                    dp[i][j]=dp[i-1][j-1];
                else{
                    dp[i][j]=Math.min(dp[i][j-1]+1,dp[i-1][j]+1);
                    dp[i][j]=Math.min(dp[i][j],dp[i-1][j-1]+1);
                }
            }
        }
        return dp[len1][len2];//不能用dp[-1][-1]
    }
}
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值