最长公共子序列
时间限制:3000 ms | 内存限制:65535 KB
难度:3
描述
咱们就不拐弯抹角了,如题,需要你做的就是写一个程序,得出最长公共子序列。
tip:最长公共子序列也称作最长公共子串(不要求连续),英文缩写为LCS(Longest Common Subsequence)。其定义是,一个序列 S ,如果分别是两个或多个已知序列的子序列,且是所有符合此条件序列中最长的,则 S 称为已知序列的最长公共子序列。
输入
第一行给出一个整数N(0< N< 100)表示待测数据组数
接下来每组数据两行,分别为待测的两组字符串。每个字符串长度不大于1000.
输出
每组测试数据输出一个整数,表示最长公共子序列长度。每组结果占一行。
样例输入
2
asdf
adfsd
123abc
abc123abc
样例输出
3
6
比较经典的动态规划问题。
使用动态规划,最主要的步骤是要分析出子问题及其重叠问题来。
对于此题,每一组字符串的长度 对于 寻找最长子序列的方法,并不会产生什么影响。例如长度为4、6与8、10的两组字符串,它们分别寻找最长子序列的方法并没有什么本质区别。正是因为这个原因,我们可以把N、M长度的字符串问题可以划分为N-1、M-1长度的问题,甚至还可以继续划分,这样实际上就产生了M+N个子问题(因为每次都是M或者N减去1而产生一个子问题),但是在这些子问题中,有很多重复地子问题,所以如果用递归解得话,会做很多重复地工作。更简单的方式是采用一个二维数组LCS[m][n]来记录所有可能的M、N取值组合下的最长公共子序列长度。
进一步分析,如何描述子问题?要分两种情况。
第一,如果str1[M]=str2[N]的情况下,最长公共子序列长度应该就是M-1、N-1长度的字符串组的最长公共子序列长度加上1。用公式表示就是LCS[M][N]=LCS[M-1][N-1]+1。
第二,如果str1[M]!=str2[N]的情况下,最长公共子序列长度应该在M-1、N 以及 M、N-1 这两个子问题之中最大公子序列长度的大者。用公式表示就是LCS[M][N]= MAX ( LCS[M-1][N] , LCS[M][N-1] )。
代码如下:
#include<stdio.h>
#include<string.h>
int main()
{
int N,i,j;
scanf("%d",&N);
while(N--)
{
char str1[1000],str2[1000];
scanf("%s%s",str1,str2);
int len1=strlen(str1),len2=strlen(str2);
int LCS[len1+1][len2+1];
memset(LCS,0,sizeof(LCS));
for(i=1;i<=len1;i++)
{
for(j=1;j<=len2;j++)
{
if(str1[i-1]==str2[j-1])
LCS[i][j]=LCS[i-1][j-1]+1;
else
LCS[i][j]= LCS[i-1][j]>LCS[i][j-1]? LCS[i-1][j]:LCS[i][j-1];
}
}
printf("%d\n",LCS[len1][len2]);
}
}