1183 编辑距离
- 1 秒
- 131,072 KB
- 0 分
- 基础题
编辑距离,又称Levenshtein距离(也叫做Edit Distance),是指两个字串之间,由一个转成另一个所需的最少编辑操作次数。许可的编辑操作包括将一个字符替换成另一个字符,插入一个字符,删除一个字符。
例如将kitten一字转成sitting:
sitten (k->s)
sittin (e->i)
sitting (->g)
所以kitten和sitting的编辑距离是3。俄罗斯科学家Vladimir Levenshtein在1965年提出这个概念。
给出两个字符串a,b,求a和b的编辑距离。
收起
输入
第1行:字符串a(a的长度 <= 1000)。 第2行:字符串b(b的长度 <= 1000)。
输出
输出a和b的编辑距离
输入样例
kitten sitting
输出样例
3
思路:
我们令dp[ i ][ j ]表示s1串起始位置到 i 变化s2串起始位置到 j 需要变换的最短距离,那么删除和替换做的操作是一样的,但是如果是替换操作的话,如果s【i】!= s【j】,那么dp[ i ][ j ] = dp[ i - 1][ j - 1] + 1;
可以用一个转移方程来表示:
i , j = 0
dp[ i ][ j ] = { j , i = 0
min(dp[ i - 1][ j ]+1,dp[ i ][ j - 1] + 1,dp[i - 1][j - 1]+s1[ i ] == s2[ j ] ? 0:1) , else
代码:
#include<bits/stdc++.h>
using namespace std;
const int maxn = 2010;
char s1[maxn],s2[maxn];
int dp[maxn][maxn];
int main()
{
while (~scanf("%s %s",s1+1,s2+1))
{
int l1 = strlen(s1+1),l2 = strlen(s2+1);
for (int i = 0;i <= l1;i ++) dp[i][0] = i;
for (int i = 0;i <= l2;i ++) dp[0][i] = i;
int flag;
for (int i = 1;i <= l1;i ++)
{
for (int j = 1;j <= l2;j ++)
{
if (s1[i] == s2[j]) flag = 0;
else flag = 1;
dp[i][j]=min(min(dp[i][j-1]+1,dp[i-1][j]+1),dp[i-1][j-1]+flag);
}
}
printf("%d\n",dp[l1][l2]);
}
return 0;
}