编辑距离 (dp)

编辑距离

编辑距离,又称Levenshtein距离(也叫做Edit Distance),是指两个字串之间,由一个转成另一个所需的最少编辑操作次数。许可的编辑操作包括将一个字符替换成另一个字符,插入一个字符,删除一个字符。
例如将kitten一字转成sitting:
sitten (k->s)
sittin (e->i)
sitting (->g)
所以kitten和sitting的编辑距离是3。俄罗斯科学家Vladimir Levenshtein在1965年提出这个概念。
给出两个字符串a,b,求a和b的编辑距离。

Input 第1行:字符串a(a的长度 <= 1000)。
第2行:字符串b(b的长度 <= 1000)。 Output 输出a和b的编辑距离 Sample Input
kitten
sitting
Sample Output
3
我们用字符串“ivan1”和“ivan2”举例来看看矩阵中值的状况:

1、第一行和第一列的值从0开始增长
这里写图片描述
图一

首先我们先创建一个矩阵,或者说是我们的二维数列,假设有两个字符串,我们的字符串的长度分别是m和n,那么,我们矩阵的维度就应该是(m+1)*(n+1).

注意,我们先给数列的第一行第一列赋值,从0开始递增赋值。我们就得到了图一的这个样子

之后我们计算第一列,第二列,依次类推,算完整个矩阵。

我们的计算规则就是:
d[i,j]=min(d[i-1,j]+1 、d[i,j-1]+1、d[i-1,j-1]+temp) 这三个当中的最小值。

其中:str1[i] == str2[j],用temp记录它,为0。否则temp记为1

我们用d[i-1,j]+1表示增加操作
d[i,j-1]+1 表示我们的删除操作
d[i-1,j-1]+temp表示我们的替换操作

2、举证元素的产生 Matrix[i - 1, j] + 1 ; Matrix[i, j - 1] + 1 ; Matrix[i - 1, j - 1] + t 三者当中的最小值
这里写图片描述

3.依次类推直到矩阵全部生成
这里写图片描述

这里写图片描述

这个就得到了我们的整个完整的矩阵。

code:

#include <iostream>
#include <cstdio>
#include <cstring>
#include <algorithm>
using namespace std;
int dp[1010][1010];
char a[1010],b[1010];
int same(char i,char j){
    if(i == j)
        return 0;
    else
        return 1;
}
int main(){
    int lena,lenb,i,j;
    while(scanf("%s%s",a,b) != EOF){
        lena = strlen(a);
        lenb = strlen(b);
        for(int i = 0; i <= lena; i++){
            dp[i][0] = i;//解释一下为什么是lena的时候先竖着赋值
            //其实我们是在看b串,也就是如果b是空串,a有多长就操作多少下,下面同理
        }
        for(int i = 0; i <= lenb; i++){
            dp[0][i] = i;
        }
        dp[0][0] = 0;
        for(int i = 1; i <= lena; i++){
            for(int j = 1; j <= lenb; j++){
                dp[i][j] = min(dp[i-1][j-1]+same(a[i-1],b[j-1]),min(dp[i-1][j]+1,dp[i][j-1]+1));
            }
        }
        printf("%d\n",dp[lena][lenb]);
    }
    return 0;
}

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值