一个给定序列的子序列是在该序列中删去若干元素后得到的序列。
若给定序列X= { x1, x2,…, xm},则另一序列Z= {z1, z2,…, zk}是X的子序列是指存在一个严格递增的下标序列
{i1, i2,…, ik},使得对于所有j=1,2,…,k有 Xij=Zj。例如,序列Z={B,C,D,B}是序列X={A,B,C,B,D,A,B}的子序列,
相应的递增下标序列为{2,3,5,7}。给定两个序列X和Y,当另一序列Z既是X的子序列又是Y的子序列时,
称Z是序列X和Y的公共子序列。
例如,若X= { A, B, C, B, D, A, B}和Y= {B, D, C, A, B, A},
则序列{B,C,A}是X和Y的一个公共子序列,序列{B,C,B,A}也是X和Y的一个公共子序列。
而且,后者是X和Y的一个最长公共子序列,因为X和Y没有长度大于4的公共子序列。
给定两个序列X= {x1, x2, …, xm}和Y= {y1, y2, … , yn},要求找出X和Y的一个最长公共子序列。
下面是算法解析:
(1)若xm=yn,则zk=xm=yn,且zk-1是Xm-1和Yn-1的最长公共子序列。
(2)若xm!=yn且zk!=xm,则Z是Xm-1和Y的最长公共子序列
(3)若xm!=yn且zk!=yn,则Z是X和Yn-1的最长公共子序列。
a.也就是说当xm=yn时,找出Xm-1和Yn-1的最长公共子序列,然后在其尾部加上 xm=yn
b.若xm!=yn时,必须找出两个子问题,找出Xm-1和Yn一个最长公共子序列及Xm和Yn-1一个最长公共子序列
这两个最长公共子序列中较长者即为X和Y的最长公共子序列。
下面是实现的代码:
#include<iostream>
#include<stdlib.h>
#include<stdio.h>
#include<iomanip>
#include<string.h>
using namespace std;
/**
m行, n列,x:序列1,y:序列2,
c:存储xy的最长公共子序列,
b记录c【i】【j】的值有哪一个问题解到的
*/
void LCSLenght(int m,int n,char *x,char *y,int **c,int **b)///计算最优值
{
for(int i=1;i<=m;i++)///行
{
c[i][0]=0;///列不变行在边
}
for(int i=1;i<=m;i++)///列
{
c[0][i]=0;///行不变列在变
}
for(int i=1;i<=m;i++)
for(int j=1;j<=n;j++)
{
if(x[i]==y[j])
{
c[i][j]=c[i-1][j-1]+1;
b[i][j]=1;
}
else if(c[i-1][j]>=c[i][j-1])
{
c[i][j]=c[i-1][j];
b[i][j]=2;
}
else
{
c[i][j]=c[i][j-1];
b[i][j]=3;
}
}
}
void LCS(int i,int j,char *x,int **b)///打印出序列x和y的最长子序列
{
if(i==0||j==0)///递归出口
return ;
if(b[i][j]==1)
{
LCS(i-1, j-1,x,b);
cout<<x[i]<<" ";
}
else if(b[i][j]==2)
{
LCS(i-1, j,x,b);
}
else
{
LCS(i, j-1,x,b);
}
}
void Output(char *a,int n)
{
for(int i=1;i<=n;i++)
{
cout<<a[i]<<" ";
}
cout <<endl;
}
int main()
{
int m=9,n=9;
char x[] = {' ','A','B','C','B','D','A','B','B','O'};
char y[] = {' ','B','D','C','A','B','A','B','B','O'};
int **c = new int *[m+1];
int **b = new int *[m+1];
for(int i=0;i<=m;i++)
{
c[i] = new int[n+1];
b[i] = new int[n+1];
}
cout<<"序列X:"<<endl;
Output(x,m);
cout<<"序列Y:"<<endl;
Output(y,n);
LCSLenght( m,n,x,y,c,b);
cout<<"序列X、Y最长公共子序列长度为:"<<c[m][n]<<endl;
cout<<endl<<endl<<"序列X、Y最长公共子序列为:"<<endl;
LCS(m,n,x,b);
cout<<endl;
}
下面是运行的结果: