
版权声明:本文为博主原创文章,未经博主允许不得转载。
问题描述
给定两个序列,求出它们的最长公共子序列。
如:序列X={a,b,c,b,d,a,b},Y={b,d,c,a,b,a},则X和Y的最长公共子序列为{b,c,b,a}
- 子序列:子序列为原序列的一个子集,并不要求连续,但要求子序列中元素的顺序和原序列元素的顺序一致。
定理
设两个序列分别是X={x1,x2……,xm},Y={y1,y2……,yn},它们的最长公共子序列为Z={z1,z2,……,zk}。
- 若xm=yn,则先求Xm-1和Yn-1的最长公共子序列,再在其尾部加上xm即可得Xm和Yn的最长公共子序列。
- 若xm!=yn,则必须分别求Xm、Yn-1和Xm-1、Yn的最长公共子序列,其中较长者就是Xm和Yn的最长公共子序列。
数据结构
-
c[i][j]:
用来记录Xi和Yj的最长公共子序列的长度。 -
s[i][j]:
用来标识Xi和Yi的最长公共子序列是由哪种情况得来:c[i][j-1]、c[i-1][j]、c[i][j]+1。
该数组能还原出最长公共子序列。
算法思路
1. 生成c数组和s数组所有元素
- 将c数组的第0行、第0列初始化为0;
- 从c数组的第一行、第一列开始,依次从左向右、从上到下填充元素值:
a)若x[i]==y[j],则c[i][j]=c[i-1][j-1]+1,s[i][j]=1;
b)若x[i]!=y[j],则分别计算c[i][j-1]、c[i-1][j],将大的那个作为c[i][j];并且,如果c[i-1][j]>=c[i][j-1],则s[i][j]=2;如果c[i-1][j]< c[i][j-1],则s[i][j]=3;
2. 根据s数组求得最长公共子序列
代码实现
- 1
- 2
- 1
- 2
1. 生成c数组和s数组所有元素
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 16
- 17
- 18
- 19
- 20
- 21
- 22
- 23
- 24
- 25
- 26
- 27
- 28
- 29
- 30
- 31
- 32
- 33
- 34
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 16
- 17
- 18
- 19
- 20
- 21
- 22
- 23
- 24
- 25
- 26
- 27
- 28
- 29
- 30
- 31
- 32
- 33
- 34
2. 根据s数组求得最长公共子序列
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
图示
-
初始化c和s数组,将第0行、第0列都设为0:
-
从第一行、第一列开始,依次从左到右、从上到下填充c和s数组:
-
当c和s都填充完毕后,就可以根据s数组找到最长公共子序列
从s数组最右下角的元素开始:
a)若s[i][j]==1,则找到一个字符,并继续比较左上角的元素;
b)若s[i][j]==2,则继续比较上方的元素;
c)s[i][j]==3,则继续比较左侧的元素。
d)直到i==0或j==0为止。