编辑距离,又称Levenshtein距离(也叫做Edit Distance),是指两个字串之间,由一个转成另一个所需的最少编辑操作次数。许可的编辑操作包括将一个字符替换成另一个字符,插入一个字符,删除一个字符。
例如将kitten一字转成sitting:
sitten (k->s)
sittin (e->i)
sitting (->g)
所以kitten和sitting的编辑距离是3。俄罗斯科学家Vladimir Levenshtein在1965年提出这个概念。
给出两个字符串a,b,求a和b的编辑距离。
Input
第1行:字符串a(a的长度 <= 1000)。 第2行:字符串b(b的长度 <= 1000)。
Output
输出a和b的编辑距离
Input示例
kitten sitting
Output示例
3
思路:
动态规划基础题考虑三种操作以及匹配成功四个转移
dp[i][j]=min(dp[i][j], dp[i-1][j]+1);//删除
dp[i][j]=min(dp[i][j], dp[i][j-1]+1); //插入
dp[i][j]=min(dp[i][j], dp[i-1][j-1]); //匹配成功
dp[i][j]=min(dp[i][j], dp[i-1][j-1]+1); //替换
代码:
#include <bits/stdc++.h>
using namespace std;
const int inf=1000000+5;
char a[1005];
char b[1005];
char c[1005];
int dp[1005][1005];
int main()
{
scanf("%s%s", a+1, b+1);
int i, j;
int n=strlen(a+1), m=strlen(b+1);
/*
if(n>m) //指考虑删除和替换的状态转移需要这样做,这里不需要
{
swap(n,m);
strcpy(c, a+1);
strcpy(a+1, b+1);
strcpy(b+1, c);
}
*/
//printf("%s\n%s\n", a+1, b+1);
for(i=0; i<=n; i++)for(j=0; j<=m; j++)dp[i][j]=inf;
dp[0][0]=0;
for(j=1; j<=m; j++)dp[0][j]=j;
for(i=1; i<=n; i++)dp[i][0]=i;
for(i=1; i<=n; i++)
{
for(j=1; j<=m; j++)
{
// printf("%d %d %d ", i, j, dp[i][j]);
dp[i][j]=min(dp[i][j], dp[i-1][j]+1); //删除
// printf("%d ", dp[i][j]);
dp[i][j]=min(dp[i][j], dp[i][j-1]+1); //插入
if(a[i]==b[j])dp[i][j]=min(dp[i][j], dp[i-1][j-1]); //匹配成功
else dp[i][j]=min(dp[i][j], dp[i-1][j-1]+1); //替换
// printf("%d\n", dp[i][j]);
}
}
printf("%d\n", dp[n][m]);
}