最长公共子序列(LCS)最常见的算法是时间复杂度为O(n^2)的动态规划(DP)算法,但在James W. Hunt和Thomas G. Szymansky 的论文”A Fast Algorithm for Computing Longest Common Subsequence”中,给出了O(nlogn)下限的一种算法。
定理:设序列A长度为n,{A(i)},序列B长度为m,{B(i)},考虑A中所有元素在B中的序号,即A某元素在B的序号为{Pk1,Pk2,..},将这些序号按照降序排列,然后按照A中的顺序得到一个新序列,此新序列的最长严格递增子序列即对应为A、B的最长公共子序列。
举例来说,A={a,b,c,d,b},B={b,c,a,b},则a对应在B的序号为2,b对应序号为{3,0},c对应序号为1,d对应为空集,生成的新序列为{2,3, 0, 1, 3, 0},其最长严格递增子序列为{0,1,3},对应的公共子序列为{b, c, b}
实现代码:(洛谷P1439):
#include<cstdio>
#include<iostream>
#include<algorithm>
#include<vector>
#include<cstring>
#include<string>
using namespace std;
const int N=1000005;
vector<int>v[N],a,d;
int main()
{
int n,i,j,A[N],B[N];
cin>>n;
for(i=1;i<=n;i++)scanf("%d",&A[i]);
for(i=1;i<=n;i++)scanf("%d",&B[i]);
for(i=n;i;i--)
v[B[i]].push_back(i);//保证后面a中的序列是按照B中从前往后的顺序出现,所以要倒序
for(i=1;i<=n;i++){
int now=A[i];
if(v[now].empty())continue;
for(int j=0;j<v[now].size();j++)//将A中的数按在B中出现的顺序加入a
a.push_back(v[now][j]);
}
if(!a.empty()){//logn的最长上升子序列
d.push_back(a[0]);
for(i=1;i<a.size();i++){
if(a[i]>d.back())d.push_back(a[i]);
else{
vector<int>::iterator iter=lower_bound(d.begin(),d.end(),a[i]);
*iter=a[i];
}
}
}
cout<<d.size()<<endl;
return 0;
}
字符串版:
#include<cstdio>
#include<iostream>
#include<algorithm>
#include<vector>
#include<string>
#include<cstring>
using namespace std;
vector<int>v[30],a,d;
int main()
{
freopen("test.in","r",stdin);
freopen("zj.out","w",stdout);
int n;string str1,str2;
cin>>n;getchar();getline(cin,str1);getline(cin,str2);
for(int i=str2.size()-1;i>=0;i--)v[str2[i]-'a'].push_back(i);
for(int i=0;i<n;i++){
int now=str1[i]-'a';
if(v[now].empty())continue;
for(int j=0;j<v[now].size();j++)
a.push_back(v[now][j]);
}
if(!a.empty()){
d.push_back(a[0]);
for(int i=0;i<a.size();i++){
if(a[i]>d.back())d.push_back(a[i]);
else{
vector<int>::iterator iter=lower_bound(d.begin(),d.end(),a[i]);
*iter=a[i];
}
}
}
cout<<d.size()<<endl;
return 0;
}
附:朴素o(n2)的最长公共子序列:
#include<cstdio>
#include<iostream>
#include<string>
#include<algorithm>
#include<cstring>
using namespace std;
int f[200005][200005];
int main()
{
freopen("test.in","r",stdin);
freopen("bl.out","w",stdout);
int n,i,j,k;
string str1,str2;
cin>>n;getchar();getline(cin,str1);getline(cin,str2);
//if(str1[0]==str2[0])f[0][0]=1;
for(i=0;i<n;i++){
for(j=0;j<n;j++){
if(str1[i]==str2[j])f[i][j]=max(f[i][j],((i==0||j==0)?0:f[i-1][j-1])+1);
else{
f[i][j]=max(f[i][j],max(i==0?0:f[i-1][j],j==0?0:f[i][j-1]));
}
}
}
cout<<f[n-1][n-1]<<endl;
return 0;
}