题目描述:
- 如何得到一个数据流中的中位数?如果从数据流中读出奇数个数值,那么中位数就是所有数值排序之后位于中间的数值。如果从数据流中读出偶数个数值,那么中位数就是所有数值排序之后中间两个数的平均值。我们使用Insert()方法读取数据流,使用GetMedian()方法获取当前读取数据的中位数。
思路
- 第一步想到的是排序,但是插入时间复杂度为O(n),得到中位数的时间复杂度为O(1)。
也可以采用其他方法,例如二叉搜索树,AVL树,但是这些在面试的十几分钟实现是不现实的。
-
采用大小堆来实现,有几个注意点:
- 最小堆的所有数据(位于从小到大排序队列的右侧)总是大于最大堆的数据。
- 我们将目前大小堆的数据和为偶数时,将要插入的数放进最小堆,如果此时新的数据比最大堆的一些数据小,则怎么办呢? 可以先将数据插入最大堆,然后排序,将最大堆的堆顶元素插入最小堆。同理… …
-
最后总数若为奇数,则直接去最小堆的堆顶元素,反之取最小堆和最大堆堆顶元素的平均值。
后备知识
参数都是一样的:
make_heap(first ,last)
make_heap(first ,last, cmpObject)
将[ first, last )范围进行堆排序,默认使用less < int>, 即 :最大元素放在第一个。
pop_heap(first ,last)
pop_heap(first ,last, cmpObject)
- 将front(即第一个最大元素)移动到end的前部,同时将剩下的元素重新构造成(堆排序)一个新的heap。
push_heap(first ,last)
push_heap(first ,last, cmpObject)
对刚插入的尾部元素做堆排序。
sort_heap(first ,last)
sort_heap(first ,last, cmpObject)
将一个堆做排序,最终成为一个有序的系列,可以看到sort_heap时,必须先是一个堆(两个特性:1、最大元素在第一个 2、添加或者删除元素以对数时间),因此必须先做一次make_heap.
class Solution {
public:
void Insert(int num)
{
if(((min.size() + max.size()) & 0x1 ) == 0)
{
if(max.size() > 0 && max[0] > num)
{
max.push_back(num);
push_heap(max.begin(), max.end(), less<int>());
num = max[0];
pop_heap(max.begin(), max.end(), less<int>());
max.pop_back();
}
min.push_back(num);
push_heap(min.begin(), min.end(), greater<int>());
}
else
{
if(min.size() > 0 && min[0] < num)
{
min.push_back(num);
push_heap(min.begin(), min.end(), greater<int>());
num = min[0];
pop_heap(min.begin(), min.end(), greater<int>());
min.pop_back();
}
max.push_back(num);
push_heap(max.begin(), max.end(), less<int>());
}
}
double GetMedian()
{
int size = min.size() + max.size();
if(0 == size)
{
return 0;
}
double median = 0;
if((size & 0x1) == 1)
{
median = min[0];
}
else
{
median = (min[0] + max[0]) * 0.5;
}
return median;
}
private:
vector<int> min;
vector<int> max;
};