求最长公共子序列

最新推荐文章于 2016-04-19 17:55:05 发布

原创最新推荐文章于 2016-04-19 17:55:05 发布 · 1k 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#动态规划 #面试笔试

动态规划专栏收录该内容

36 篇文章

订阅专栏

本文探讨了如何使用动态规划解决寻找两个字符串最长公共子序列的问题，并展示了该方法在求解最长回文子序列的应用。

题目：

给两个字符串a,b，找出他们两的最长公共子序列长度，和一个最长公共子序列。

比如：a = “ABCBDAB”， b = “BDCABA”;

则最大子序列长度是4，满足的子序列有B D A B。

思路：

注意是子序列，不是子串，子序列不要求连续。
动态规划。
dp[i][j]表示字符串a从0~i位置，字符串b从0~j位置，此时的最长公共子序列。

如果i位置与j位置对应的字符相同，那么当前位置的LCS的长度等于上一个位置的LCS长度+1，即为dp[i][j]=dp[i-1][j-1]+1；

如果i位置与j位置对应的字符不相同，可能会是i-1位置与j位置字符相同，也可能是i与j-1位置字符相同。那么当前位置的LCS的长度要么等于(i-1,j)位置的，要么等于(i,j-1)位置的。dp[i][j]=max(dp[i-1][j],dp[i][j-1]);

再用一个二维数组记录路径。
seq=”“;代表我们要找的子序列
path[n][m]
如果a[i]=b[j]，那么path[i][j]此处对应的状态设为0，可以加入到seq中；
如果a[i]≠b[j]，那么path[i][j]为1表示从(i-1,j)到(i,j)，如果path[i][j]为-1表示从(i,j-1)到(i,j)

我们根据记录的路径状态递归回溯将相同的字符加入到seq中。

代码：

#include<iostream>
#include<string>
#include<vector>
#include<algorithm>
using namespace std;

int findLongestCommonSubsequenceLength(string &a,string& b,vector<vector<int>> &path){
    int la = a.size();
    int lb = b.size();
    vector<vector<int>> dp(la+1,vector<int>(lb+1,0));
    for (int i = 1; i <= la; i++){
        for (int j = 1; j <= lb; j++){
            if (a[i-1] == b[j-1]){
                dp[i][j] = dp[i-1][j-1] + 1;
                path[i][j] = 0;
            }
            else{
                dp[i][j] = max(dp[i - 1][j], dp[i][j - 1]);
                path[i][j] = dp[i - 1][j] > dp[i][j - 1] ? 1 : -1;
            }
        }
    }
    return dp[la][lb];
}
void LongestCommonSubsesequence(int i,int j,string &seq,vector<vector<int>> &path,string &a){
    if (i < 1 || j < 1){
        return;
    }
    if (path[i][j] == 0){
        LongestCommonSubsesequence(i-1,j-1,seq,path,a);
        seq += a[i-1];
    }
    else if (path[i][j] == 1){
        LongestCommonSubsesequence(i-1,j,seq,path,a);
    }
    else if (path[i][j] == -1){
        LongestCommonSubsesequence(i,j-1,seq,path,a);
    }
}
int main()
{
    string a = "ABCBDAB";
    string b = "BDCABA";
    int la = a.size();
    int lb = b.size();
    vector<vector<int>> path(la + 1, vector<int>(lb + 1));
    printf("%d\n", findLongestCommonSubsequenceLength(a, b,path));
    string seq;
    LongestCommonSubsesequence(la,lb,seq,path,a);
    cout << seq;
    system("pause");
    return 0;
}