编辑距离问题
题目描述
设A 和B 是2 个字符串。要用最少的字符操作将字符串A转换为字符串B。
字符操作包括:
(1) 删除一个字符;
(2) 插入一个字符;
(3) 将一个字符改为另一个字符
也就是说将字符串A 变换为字符串B 所用的最少字符操作数称为字符串A 到B 的编辑距离,记为d(A,B)。
试设计一个有效算法,对任给的2个字符串A 和B,计算出它们的编辑距离d(A,B)
解题思路
m[i][j]表示字符串A和B的编辑距离,
即为A从第0个字符开始到第i个字符和B从第0个字符开始到第j个字符,这两个字串的编辑距离。
*字符串的下标从1开始
临界条件:
当i和j同时为0时,则编辑距离为0;当i=0,j不为0是,则需插入B串中的字符,则编辑距离为j;当i不为0,j=0是,则说明B为空串,需要删除A串中i个字符,编辑距离为i。
动态规划方程:
m[i][j] =
A[i]=B[i]时 m[i-1][j-1]
A[i]!=B[i]时 min(m[i-1][j]+1,m[i][j-1]+1,m[i-1][j-1] + 1)
1.m[i-1][j]+1 给B串的最后插入了A串的最后的字符;
2.m[i][j-1]+1 将B串的最后字符删除;
3.m[i-1][j-1]+1 将B串的最后一个字符替换为A串的最后一个字符
具体代码实现
#include<stdio.h>
#include<string.h>
#define N 100
int m[N][N];
int min(int a,int b, int c){
int temp = a<b?a:b;
return temp<c?temp:c;
}
int String_Distance(char A[],char B[],int L1,int L2){
for(int i=0;i<L1;i++){
for(int j=0;j<L2;j++){
if(i==0 && j==0) m[i][j]=0;
else if(i==0 && j!=0) m[i][j] = j;
else if(i!=0 && j==0) m[i][j] = i;
else{
if(A[i] == B[j]) m[i][j] = m[i-1][j-1];
else m[i][j]=min(m[i-1][j] + 1,m[i-1][j-1] + 1,m[i][j-1] + 1);
}
}
}
return m[L1-1][L2-1];
}
int main(){
char A[N],B[N];
printf("请输入字符串A:");
gets(A);
printf("请输入字符串B:");
gets(B);
char t='#'; //使A,B字符串从下标为1开始存储
for(int i=0;i<=strlen(A);i++){
char temp=A[i];
A[i]=t;
t=temp;
}
t='#';
for(int i=0;i<=strlen(B);i++){
char temp=B[i];
B[i]=t;
t=temp;
}
int d=String_Distance(A,B,strlen(A),strlen(B));
printf("d(A,B)=%d",d);
return 0;
}