题意:给定两个已排序的数组,找出合起来的中位数。
难度:hard
思路:参考
https://discuss.leetcode.com/topic/4996/share-my-o-log-min-m-n-solution-with-explanation
将中位数理解为把一个集合分成两个长度相等(或相差1)的子集,并且一个子集的所有元素都不大于另一个子集。
现在要做的是把A、B数组划分成相同的两部分left和right,使得:
(1)left和right的元素个数相等(当m+n为偶数),或者left元素个数比right多1(当m+n)为奇数。
(2)left的元素不大于right的元素。
如果能找到这样的划分,中位数就是left中的最大值和right中的最小值其中的一个。
找到这个划分的方法:
假设把A中的前i个元素划分到left集合,由于left元素个数占(m+n)的一半,所以相应地,B的前( (m+n+1)/2-i )个元素被划分到left集合。right集合就是A、B剩下的元素。这样left和right都确定了,然后需要判断这样的划分方法能不能满足上面的要求(2),如果满足就是我们需要的集合。
所以问题就变成了查找这个i值,可以用二分查找法。设j=(m+n+1)/2-i ,问题转化为判断由A的前i个元素和B的前j个元素是否不大于A和B剩下的元素。因为A和B都是有序的,只需要判断A[i]和B[j-1]、A[i-1]和B[j]这两组数的大小。如果A[i]<B[j-1],说明i太小了。如果B[j]<A[i-1],说明i太大了。否则就说明i是正确的i。
复杂度:使用了二分查找,粗略计算算法的复杂度是O(log(m+n))。但是由于二分查找的区间是[ max(0,(m+n+1)/2-n), min(m,(m+n+1)/2) ],所以复杂度是O(log(min(n+m))。查找区间不是[0,m+n]是因为要考虑划分时最多把A的m个元素或者B的n个元素划分到left集合。
代码:
class Solution {
public:
double findMedianSortedArrays(vector<int>& nums1, vector<int>& nums2) {
int m=nums1.size(),n=nums2.size();
int low=max(0,(m+n+1)/2-n),high=min(m,(m+n+1)/2);
int i,j;
while(low<=high)
{
i=(low+high)/2;
j=(m+n+1)/2-i;
if((i!=m&&j!=0)&&nums2[j-1]>nums1[i])
{
low=i+1;
}
else if((j!=n&&i!=0)&&nums1[i-1]>nums2[j])
{
high=i-1;
}
else
{
break;
}
}
int left,right;
if(i==0) left=nums2[j-1];
else if(j==0) left=nums1[i-1];
else left=max(nums1[i-1],nums2[j-1]);
if(i==m&&j==n) right=0;
else if(i==m) right=nums2[j];
else if(j==n) right=nums1[i];
else right=min(nums1[i],nums2[j]);
if((m+n)%2) return left;
else return (left+right)/2.0;
}
};