【DP算法】Longest Common Subsequence - 最长公共子序列

本文介绍最长公共子序列(LCS)的概念及其在生物信息学中的应用,并详细解析了使用动态规划求解LCS问题的方法,包括问题分析、递推公式及C++实现。

最长公共子序列,英文缩写为LCS(Longest Common Subsequence)。其定义是,一个序列 S ,如果分别是两个或多个已知序列的子序列,且是所有符合此条件序列中最长的,则 S 称为已知序列的最长公共子序列。而最长公共子串(要求连续)和最长公共子序列是不同的。

序列比对算法是生物信息学中经常使用的方法,而寻找两个序列的最长公共子序列也是其中的基础。除了暴力查找,动态规划是解决最长公共子序列的常用算法。

问题分析

假设Zk={z1,z2,,zk}|Zk={z1,z2,⋯,zk}|是序列Xm={x1,x2,,xm}Xm={x1,x2,⋯,xm}Yn={y1,y2,,yn}Yn={y1,y2,⋯,yn}的最长公共子序列。那么其中可能存在的子问题有三个:
1. zk=xm=ynzk=xm=yn,则Zk1Zk−1Xm1Xm−1Yn1Yn−1的最长公共子序列
2. zkxm,xmynzk≠xm,xm≠ynZkZkXm1Xm−1YnYn的最长公共子序列
3. zkyn,xmynzk≠yn,xm≠ynZkZkXmXmYn1Yn−1的最长公共子序列
由以上分析(三点均可用反证法证明),可以得到问题的递推公示:
c[i][j]c[i][j]表示序列XiXiYiYi的最长公共子序列的长度,则有:

c[i][j]=0c[i1][j1]+1max{c[i][j1],c[i1][j]}i=0j=0i,j>0xi=yi.i,j>0xiyi.c[i][j]={0i=0或j=0c[i−1][j−1]+1i,j>0且xi=yi.max{c[i][j−1],c[i−1][j]}i,j>0且xi≠yi.

程序实现

#include <iostream>
#include <stdio.h>
#include <stdlib.h>
#include <string.h>

#define NUM 1000

using namespace std;

int c[NUM][NUM];
int b[NUM][NUM];

void LCSLength(int m,int n,char x[],char y[]);
void LCS(int m,int n,char x[]);

int main(int argc, char *argv[]) {
    char x[NUM];
    char y[NUM];
    int m, n;
    scanf("%d\n", &m);
    for (int i=1; i<=m; i++)
        scanf("%c", &x[i]);
    scanf("%d\n", &n);
    for (int i=1; i<=n; i++)
        scanf("%c", &y[i]);
    LCSLength(m, n, x, y);
    printf("%d\n", c[m][n]);
    LCS(m,n,x);
    return 0;
}

void LCSLength(int m,int n,char x[],char y[]){
    int i,j;
    for(i = 1; i <= m; i++)
        c[i][0] = 0;
    for(j = 1; j <= n; j++)
        c[0][j] = 0;
    for(i = 1; i <= m; i++) {
        for(j = 1; j <= n; j++) {
            if(x[i] == y[j]) {
                c[i][j] = c[i-1][j-1] + 1;
                b[i][j] = 1;
            }
            else if(c[i-1][j] >= c[i][j-1]) {
                c[i][j] = c[i-1][j];
                b[i][j] = 3;
            }
            else {
                c[i][j] = c[i][j-1];
                b[i][j] = 2;
            }
        }
    }
}
void LCS(int i,int j,char x[]) {
    if(i == 0 || j == 0)
        return;
    if(b[i][j] == 1) {
        LCS(i-1,j-1,x);
        cout << x[i];
    }
    else if(b[i][j] == 2)
        LCS(i,j-1,x);
    else
        LCS(i-1,j,x);
}
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值