最长公共子序列&最长公共子串

最长公共子序列

1、算法的定义

最长公共子序列(LCS)问题是分别给出长度为i和j的字符串想X,Y,然后找出其中最长公共子序列的最优值和最优解。

2、算法的理解

1)由于最长公共子序列问题属于动态规划问题,所以在求解的时候需要对其分析相关的状态,

       总结出状态转移方程。逆向思维从结果到过程的思考分析。

2)对于当前问题的状态分析如下

     
     
  1.  假设LCS序列Z长度为k
  1. 当字符串X或者Y的长度为0时(I 或者j为0),LCS序列Z(k) = 0
  1. 当X(i)=Y(j)时, Z(k) = X(i)=Y(j) ,所以它们的最后一个字符是相等的。此时必然 会存在Z(k-1)∈X(i-1)   或者 Z(k-1)∈Y(j-1),所以L[i. j] 与L[i-1,j-1]相差1, 即L[i, j] = L[i-1,j-1]+1
  1.  当X(i) !=Y(j)时 Z(k) ∈X(m<=i) 或Z(k) ∈Y (n<=j)( m与n不相等),此时的Z中的K值  必然存在于max{m,n}中。   根据以上信息得到:LCS([I, o] >= LCS[m , o]   和  LCS([o, j]>= LCS[o , n]。即:L[ i ,j] = max{ L[i-1 , j] , L[ I , j-1] }
  1.  总结得到如下的状态转移方程

3、算法实现

4、实现解析

假设两个字符串A为”ABCBDAB” B为“BDCABA”,需要写的二维表为L[8][7]。

a)        第一个for循环填写表中第一列,初始值都为0;

b)        第二个for循环填写表中第一行,初始值都为0;

c)        接下来两个嵌套循环用于填表( ==  或者 != 的情况)填表结果如下:L[7][6]为LCS的值。

*在获取所有符合当前LCS值得公共子序列时,需要记录利用回溯法,递归的遍历当前问题到子问题的路径。用一个track[8][7]数组记录

  所有公共子串:BDAB BCAB BCBA(主要看斜对角线上的值)

最长公共子串的求解:

1.   两个字符串的最长公共子串,这个子串要求在原字符串中是连续的。采用一个二维数组来存储中间结果。

2.   假设两个字符串分别是:A=”baba”B=”caba”i代表A字符串的当前位置, j代表B当前字符串的位置,当 == 时,对应的元素值为1 ,否则为0,。生成如下表:

3.  斜对角线上值为1的字符组成的字符串为公共子串,最长的为最长公共子串(aba)。

²  算法改进:

由于在搜索最长公共子串时需要花费大量的时间,所以当 == 时,对应的元素值为T[i-1][j-1]+1,否则为0。生成结果如下表:


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值