问题表述:
给出一个由n个数组成的序列A[1..n],找出它的最长单调上升子序列。即求最大的m和a1,a2……,am,使得a1 < a2 < …… < am且A[a1] <= A[a2] <= …… <= A[am]。
基本方法:动态规划
设f(i)为以A[i]结尾的最长单调上升子序列的长度,那么所求m即为f = max{f(i), 1 <= i <= n}。
f(i) = 1 + max{0, f(j) | A[j] <= A[i], 1 <= j < i} --- (1)
基本性质:如果A[i] < A[j],但是f(i) > f(j),那么在计算f(k), k > i, k > j的过程中再也不必用到A[j],即在(1)的解不可能是
f(k) = f(j) + 1,A[j]可以删除了。
证明:反证,如果(1)的解为f(k) = f(j) + 1,那么A[j] <= A[k],又A[i] < A[j],那么A[i] <= A[k],
且f(k') = 1 + f(i) > 1 + f(j) = f(k),这与f(k) = f(j) + 1为(1)的解矛盾。
基本性质可以表叙为:在保留下来的元素中,如果A[i] < A[j],那么f(i) <= f(j)。显然的如果i < j,那么f(i) < f(j),
因为f(j) >= 1 + f(i) > f(i)。
得到算法
09-25行具有下面的循环不变性:
(i) 保留元素A[idx_kept[0]] <= A[idx_kept[1]] <= ... <= A[idx_kept[idx_kept_num-1]],
且f(idx_kept[i]) = i, 0 <= idx_kept_num-1。
(ii) path[i]记录了式(1)的解。
初始化:显然成立
循环性质维护:
1)如果保留元素中存在元素大于A[i],记满足该条件的最小元素为A[idx_kept[larger]],A[idx_kept[larger]] > A[i],
根据假设(i)那么式(1)的解为f(i) = f(idx_kep[larger - 1]) + 1 = larger,path[i]记录了这个解idx_kept[larger - 1](第17行),
如果larger为0则特殊处理一下(第14行),(ii)成立。根据假设(i),f(i) = f(idx_kept[larger]) = larger,又A[idx_kept[larger]] > A[i],因此在后面的f汉顺计算中再也不会用到A[idx_kept[larger]],所以把A[idx_kept[larger]]删除,并把A[i]放到正确的位置(第19行),且A[idx_kept[larger-1]] <= A[i] < A[idx_kept[larger]] < A[idx_kept[larger+1]],所以(i)也成立。
结束:i==el_num,所有元素的path值都得到计算,且保留元素的长度就为最长单调上升子序列的长度。
时间复制度:
优化前:O(1+2+...+n-1)=O(n^2)。
优化后:O(nlgn),因此每次循环查找次数最多为lgn
完整程序如下