最大公共子序列LCS

最新推荐文章于 2024-10-17 13:03:21 发布

原创

最新推荐文章于 2024-10-17 13:03:21 发布 · 621 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#python #算法

本文探讨了最大公共子序列问题的实际应用场景，如在线编程竞赛的相似度判定及基因序列同源性的评估，并介绍了该问题的基本概念、递归解决思路及其存在的性能瓶颈。通过对比递归方法与动态规划方法，阐述了如何优化算法以提高效率。

实用意义

面对经典算法，经常有同志质疑：为什么要研究这个问题，是不是吃得太饱？
这里说一下最大公共子序列问题的实际意义：
两个场景：

某个上万人参加的在线OJ考试，为了避免抄袭，需要用机器断定出任意两个提交的相似度。我们假设作弊者没有充分的时间和能力，只能多次对原稿进行如下两个操作之一：a添加一行，b删除一行。
两段基因序列，可能同源，在复制过程中，可能会丢失了某些位置的碱基对，也可能会把某些碱基对复制错。我们想知道两个序列同源的可能性多大。

示例

我们以字符串代表序列，不影响问题的本质。
那么，最大公共子序列长度 lcs(a,b) 有如下示例：
lcs(‘abc’,‘abc’) == 3
lcs(‘abxc’,‘yaubuc’) == 3
lcs(‘xaabcud’, ‘yyaabababcccd’) == 5
可见：
所谓子串，是指从某个位置开始，连续的一个区间组成的串。
所谓子序列，是从一系列的可能连续，可能不连续的位置取出字符，组成的串。
LCS问题就是：对给定的两个序列，怎样取它们的子序列，才能让它们的子序列相同，并且尽可能地长呢？

递归的想法

两个序列A,B
它们去掉第一个字符的序列分别为A’,B’
考虑它们的第一个字符是否相同：
如果相同，变成了简单问题：只要求出 lcs(A’, B’) 再加 1 就好了。
如果不同，复杂了，来求 3 个：
lcs(A’, B)
lcs(A, B’)
lcs(A’, B’)
这三个谁大，谁是答案。

这个用python实现起来也相当简单：

def lcs(a,b):
    if a=='' or b=='': return 0
    if a[0] == b

最低0.47元/天解锁文章

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。