莱文斯坦距离(Levenshtein)

莱文斯坦距离是编辑距离的一种,指两个字符串之间,由一个转成另一个所需的最少编辑操作次数。可以删除、加入、取代字符串中的任何一个字符。

在数学上,两个字符串a,b的莱文斯坦距离记作

其中:|a|和|b|分别表示字符串a和b的长度,字符 l (L)是当a[i]!=b[j]时值为1,否则为0;

指 字符串a 的前 i个字符和b的前j个字符之间的距离

性质:

1.莱文斯坦距离不大于两个字符串之间最长的字符串长度

2.如果两个字符串相等,那么他们的莱文斯坦距离为0

例题:

编辑距离

题目描述

设 A 和 B 是两个字符串。我们要用最少的字符操作次数,将字符串 A 转换为字符串 B。这里所说的字符操作共有三种:

  1. 删除一个字符;
  2. 插入一个字符;
  3. 将一个字符改为另一个字符。

输入格式

A, B 均只包含小写字母。

第一行为字符串 A;第二行为字符串 B;字符串 A, B 的长度均小于 2000。


输出格式

只有一个正整数,为最少字符操作次数。

样例 

样例输入

sfdqxbw

gfdgw

样例输出 

4

提示

对于 100 % 的数据,1 <=|A|, |B| <=2000。

思路:

i==0时,即s1为空,那么对应的dp[0][j]的值就为j:增加j个字符,使s1转化为s2

j==0时,即s2为空,那么对应的dp[i][0]的值就为i:减少i个字符,使s1转化为s2

#include<stdio.h>
#include<string.h>
char s1[10000],s2[10000];
int dp[10000][10000];
int min(int x,int y)
{
    return x<y?x:y;
}
int main()
{
    scanf("%s",s1);
    scanf("%s",s2);
    for(int i=1;i<=strlen(s1);i++)
        dp[i][0]=i;
    for(int i=1;i<=strlen(s2);i++)  //边界状态,因为将s1串无字符编导s2串i个字符时需要加i个字符,s2无字符同理
        dp[0][i]=i;
    for(int i=1;i<=strlen(s1);i++)
        for(int j=1;j<=strlen(s2);j++)
    {
        int flag=1;
        if(s1[i-1]==s2[j-1])
               flag=0;
        dp[i][j]=min(min(dp[i-1][j]+1,dp[i][j-1]+1),dp[i-1][j-1]+flag);  //若当前s1、s2串指向字符相等则不进行‘改’的操作
    }
    printf("%d\n",dp[strlen(s1)][strlen(s2)]);
    return 0;

}

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值