莱文斯坦距离是编辑距离的一种,指两个字符串之间,由一个转成另一个所需的最少编辑操作次数。可以删除、加入、取代字符串中的任何一个字符。
在数学上,两个字符串a,b的莱文斯坦距离记作
其中:|a|和|b|分别表示字符串a和b的长度,字符 l (L)是当a[i]!=b[j]时值为1,否则为0;
指 字符串a 的前 i个字符和b的前j个字符之间的距离
性质:
1.莱文斯坦距离不大于两个字符串之间最长的字符串长度
2.如果两个字符串相等,那么他们的莱文斯坦距离为0
例题:
编辑距离
题目描述
设 A 和 B 是两个字符串。我们要用最少的字符操作次数,将字符串 A 转换为字符串 B。这里所说的字符操作共有三种:
- 删除一个字符;
- 插入一个字符;
- 将一个字符改为另一个字符。
输入格式
A, B 均只包含小写字母。
第一行为字符串 A;第二行为字符串 B;字符串 A, B 的长度均小于 2000。
输出格式
只有一个正整数,为最少字符操作次数。
样例
样例输入
sfdqxbw
gfdgw
样例输出
4
提示
对于 100 % 的数据,1 <=|A|, |B| <=2000。
|
#include<stdio.h>
#include<string.h>
char s1[10000],s2[10000];
int dp[10000][10000];
int min(int x,int y)
{
return x<y?x:y;
}
int main()
{
scanf("%s",s1);
scanf("%s",s2);
for(int i=1;i<=strlen(s1);i++)
dp[i][0]=i;
for(int i=1;i<=strlen(s2);i++) //边界状态,因为将s1串无字符编导s2串i个字符时需要加i个字符,s2无字符同理
dp[0][i]=i;
for(int i=1;i<=strlen(s1);i++)
for(int j=1;j<=strlen(s2);j++)
{
int flag=1;
if(s1[i-1]==s2[j-1])
flag=0;
dp[i][j]=min(min(dp[i-1][j]+1,dp[i][j-1]+1),dp[i-1][j-1]+flag); //若当前s1、s2串指向字符相等则不进行‘改’的操作
}
printf("%d\n",dp[strlen(s1)][strlen(s2)]);
return 0;
}