最长公共子序列（Longest Common Subsequence）

颹蕭蕭

于 2020-03-03 23:29:29 发布

阅读量1.9k

点赞数 1

CC 4.0 BY-SA版权

分类专栏：数据结构与算法时间序列编程语言

我们不生产知识，我们只是互联网的搬运工

本文链接：https://blog.youkuaiyun.com/itnerd/article/details/104643908

编程语言同时被 3 个专栏收录

240 篇文章

订阅专栏

90 篇文章

订阅专栏

数据结构与算法

25 篇文章

订阅专栏

最长公共子序列（LCS）是比较两个符号序列相似性时很常用的方法。

比如在文章查重方面，比较一下公共部分的占比就可以判定两篇文章有没有抄袭。

下面来看看解法：

暴力穷举

虽说是暴力法，写出来还是很精炼的，乍眼一看好像没毛病

def LCS(X, Y):
    if not X or not Y:
        return ""
    x, m, y, n = X[0], X[1:], Y[0], Y[1:]
    if x == y:
        return x+LCS(m, n)
    else:
        # Use key=len to select the maximum string in a list efficiently
        return max(LCS (X, n), LCS(m, Y), key=len)

#assert(LCS('ABCBDAB', 'BDCABA')=='BCBA')

如果只需要计算子序列长度

def LCS_length(X, Y):
    if not X or not Y:
        return 0
    x, m, y, n = X[0], X[1:], Y[0], Y[1:]
    if x == y:
        return 1+LCS_length(m, n)
    else:
        # Use key=len to select the maximum string in a list efficiently
        return max(LCS_length(X, n), LCS_length(m, Y))

时间复杂度有多少呢？

假设 X 长度为 m，Y 长度为 n，则有递归式：
$T (m, n) = T (m - 1, n) + T (m, n - 1)$
在这里插入图片描述
感受一下对角元的增速

动态规划

开辟 $O (m n)$ 的数组

def LCS_dp(X, Y):
    Table = [[0 for j in range(len(Y) + 1)] for i in range(len(X) + 1)]
    # row 0 and column 0 are initialized to 0 already
    for i, x in enumerate(X):
        for j, y in enumerate(Y):
            if x == y:
                Table[i + 1][j + 1] = Table[i][j] + 1
            else:
                Table[i + 1][j + 1] = max(Table[i + 1][j], Table[i][j + 1])
    # read the substring out from the matrix
    result = ""
    x, y = len(X), len(Y)
    while x != 0 and y != 0:
        if Table[x][y] == Table[x - 1][y]:
            x -= 1
        elif Table[x][y] == Table[x][y - 1]:
            y -= 1
        else:
            assert X[x - 1] == Y[y - 1]
            result = X[x - 1] + result
            x -= 1
            y -= 1
    return result

博客等级

码龄9年

725
原创

3538
点赞

1万+
收藏

6万+
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

上一篇：: 字典学习 (Dictionary Learning) —— K-SVD 算法

下一篇：: 时间序列预测 —— 为什么线性自回归模型（AR）有效？

最新评论

手把手教你在 PPT中插入 LaTex 数学公式
kleas: https://blog.youkuaiyun.com/kleas/article/details/147572086?spm=1001.2014.3001.5502
离散傅里叶变换（DFT）
2401_89861164: 这个傅立叶系数和原信号的表示是不是和DFT有些不同1/N的位置调了一下
构建高性能异步任务引擎：FastAPI + Celery + Redis
北风之神c: 总结的很全面，写得赞，博主用心了。 celery对目录层级文件名称格式要求太高，只适合规划新的项目，对不规则文件夹套用难度高。所以新手使用celery很仔细的建立文件夹名字、文件夹层级、python文件名字。所以网上的celery博客教程虽然很多，但是并不能学会使用，因为要运行起来需要以下6个方面都掌握好，博客文字很难表达清楚或者没有写全面以下6个方面。 celery消费任务不执行或者报错NotRegistered，与很多方面有关系，如果要别人排错，至少要发以下6方面的截图，因为与一下6点关系很大。 1)整个项目目录结构, 2）@task入参 ,3）celery的配置，4）celery的配置 include ,5）cmd命令行启动参数 --queues= 的值,6）用户在启动cmd命令行时候，用户所在的文件夹。在不规范的文件夹路径下，使用celery难度很高，一般教程都没教。 [项目文件夹目录格式不规范下的celery使用演示](https://github.com/ydf0509/celery_demo) 。此国产分布式函数调度框架 funboost python万能通用函数加速器 https://funboost.readthedocs.io/zh-cn/latest/articles/c1.html ，从用法调用难度，用户所需代码量，超高并发性能，qps控频精确程度，支持的中间件类型，任务控制方式，稳定程度等20个方面全方位超过celery。发布性能提高1000%，消费性能提高2000%。 python万能分布式函数调度框架funboost支持python所有类型的并发模式和一切知名消息队列中间件，python函数加速器，只需要一行代码调度任意函数，框架包罗万象,万能编程功能宝典，一统编程思维，与业务不绑定，适用范围广。 pip install funboost
构建高性能异步任务引擎：FastAPI + Celery + Redis
颹蕭蕭: https://chromewebstore.google.com/search/bionic
构建高性能异步任务引擎：FastAPI + Celery + Redis
2401_90030516: 您好！可以问问您2022年发的一个bionic reading 的浏览器插件怎么下载吗？最近刷到小红书推荐的阅读方法，浏览器收索第一个就是您的帖子，所以前来询问不好意思在最新的帖子发无关的消息

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

颹蕭蕭 白嫖？

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。