动态规划算法----最短编辑距离与最长公共子序列

参考:https://blog.youkuaiyun.com/u014247371/article/details/26158635

(一)先谈最短编辑距离

问题描述:编辑距离(Edit Distance),又称Levenshtein距离,是指两个字串之间,由一个转成另一个所需的最少编辑操作次数。许可的编辑操作包括将一个字符替换成另一个字符,插入一个字符,删除一个字符。

例如将kitten一字转成sitting:sitten (k→s)sittin (e→i)sitting (→g)

同样的,我们定义c[i][j]为字符串X(i)向字符串Y(j)转换的操作步骤数。

类似的,我们考虑如果

(a). X(i)的最后一个字符x(i)==Y(j)的最后一个字符y(j)

那么c[i][j]=c[i-1][j-1];     

因为由定义我们知道c[i-1][j-1]是字符串X(i-1)向字符串Y(j-1)的编辑次数,最后一个字符相等的话即x(i)==Y(j),那么最后一个字符无需编辑即完成了字符串X(i)向Y(j)的编辑。

(b).X(i)的最后一个字符!=Y(j)的最后一个字符y(j)

这里又要分三种情况

(1)如果最后一个字符x(i)需要替换成y(j)话,那么 c[i][j]=c[i-1][j-1]+1;

(2)如果最后一个字符x(i)需要删除的话,那么     c[i][j]=c[i-1][j]+1;   

因为由定义可知,c[i-1][j]是字符串X(i-1)转换成Y(j)所需的操作次数,那么也就是说在字符串X(i-1)已经成功转换成了Y(j),那么显然最后一个字符x(i)需要删除

(3)如果需要在最后一个字符x(i)后面添加一个字符即y(j)的话,那么c[i][j]=c[i][j-1]+1;

因为由定义知道,c[i][j-1]是字符串X(i)转换成Y(j-1)所需的操作次数,想要转换成Y(j)的话,只能增加一步添加字符的操作,即插入字符y(j)

综上所述:

(a). X(i)的最后一个字符x(i)==Y(j)的最后一个字符y(j)

那么c[i][j]=c[i-1][j-1];    

(b)在X(i)的最后一个字符!=Y(j)的最后一个字符y(j)时候,

递推关系:c[i][j]=min(c[i-1][j],c[i][j-1])+1;

边界条件:c[i][0]=i,i=1,2,......n

                  c[0][j]=j,j=1,2,.........m

csdn编程挑战模块有道简易版的编辑距离问题 http://student.youkuaiyun.com/mcs/programming_challenges   

描述如下 :

传统的编辑距离里面有三种操作,即增、删、改,我们现在要讨论的编辑距离只允许两种操作,即增加一个字符、删除一个字符。我们求两个字符串的这种编辑距离,即把一个字符串变成另外一个字符串的最少操作次数。 输入格式: 多组数据,每组数据两行,每行一个字符串。每个字符串长度不超过1000,只有大写英文字母组成。 输出格式: 每组数据输出一行包含一个整数,表示需要最少操作的次数。

通过代码如下:

#include <cstdio>
#include <stdlib.h>
#include <cstring>

int min(int a, int b)
{
    return a<b ? a : b;
}

int c[100][100];
char stra[100]; char strb[100];

int main()
{
    while (scanf("%s", stra) != EOF)
    {
        scanf("%s", strb);

        int lena = strlen(stra); int lenb = strlen(strb);

        for (int i = 0; i <=lena; ++i)     //字符数组stra作为表格的列,strb作为表格的行
            c[0][i] = i;                  //注意此处当一个序列是空,另一个不空时,改动次数时非空序列的strlen()
        for (int j = 0; j <= lenb; ++j)
            c[j][0] = j;

        for (int i = 1; i <= lenb; ++i)
            for (int j = 1; j <= lena; ++j)
            {
                if (stra[i-1] == strb[j-1])        //字符再数组中是从0开始的,所以此处是i-1,j-1
                    c[i][j] = c[i - 1][j - 1];

                else
                {
                    c[i][j] = min(c[i - 1][j], c[i][j - 1])+1;
                }
            }

        printf("%d\n", c[lenb][lena]);
    }

    return 0;
}

关于本文的scanf用法:https://blog.youkuaiyun.com/qq_34793133/article/details/80579587

再试下这个,一个道理

#include "stdio.h"  
#include "string.h"  
#include "stdlib.h"  

char stra[1010];
int main()
{
while(scanf("%s", stra)!=EOF)
printf("%s\n", stra);

return 0;
}

最长公共子序列 https://www.cnblogs.com/en-heng/p/3963803.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值