题目描述:
如何得到一个数据流中的中位数?如果从数据流中读出奇数个数值,那么中位数就是所有数值排序之后位于中间的数值。如果从数据流中读出偶数个数值,那么中位数就是所有数值排序之后中间两个数的平均值。我们使用Insert()方法读取数据流,使用GetMedian()方3 法获取当前读取数据的中位数。
思路:
对于数据流,对应的就是在线算法了,一道很经典的题目就是在1亿个数中找到最大的前100个数,这是一道堆应用题,找最大的前100个数,那么我们就创建一个大小为100的最小化堆,每来一个元素就与堆顶元素比较,因为堆顶元素是目前前100大数中的最小数,前来的元素如果比该元素大,那么就把原来的堆顶替换掉。
那么对于这一道题呢?如果单纯的把所有元素放到一个数组里,每次查找中位数最快也要O(n),综合下来是O(n^2)的复杂度。我们可以利用上面例子中的想法,用一个最大堆来维护当前前n/2小的元素,那么每次找中位数只到取出堆顶就可以了。但是,有一个问题,数据要动态增长,有可能之前被替换掉的元素随着元素的增加又跑回来了,所以我们不能单纯得向上题一样把元素丢掉,我们可以再用一个最小化堆来存前n/2大的元素。
代码:
class Solution {
public:
vector<int> min;
vector<int> max;
void Insert(int num) {
if(((min.size()+max.size())&1)==0) {// 总数为偶,最大堆和最小堆数字个数相等,加入最小堆
if (max.size() > 0 && num < max[0]){
max.push_back(num); // 插入最大堆
push_heap(max.begin(), max.end(), less<int>()); // 调整顺序
num = max[0]; // 拿到最大值
pop_heap(max.begin(), max.end(), less<int>()); // 从最大堆中把最大值删除
max.pop_back();
}
min.push_back(num); // 加入最小堆
push_heap(min.begin(), min.end(), greater<int>()); // 调整顺序
}
else { // 加入最大堆
if (min.size() != 0 && num > min[0]) {
min.push_back(num);
push_heap(min.begin(), min.end(), greater<int>());
num = min[0];
pop_heap(min.begin(), min.end(), greater<int>());
min.pop_back();
}
max.push_back(num);
push_heap(max.begin(), max.end(), less<int>());
}
}
double GetMedian() {
int size = max.size() + min.size();
if (size == 0) return 0;
if ((size&1) == 0) {
int num = max[0] + min[0];
return num*1.0/2;
}
else return min[0];
}
};
判断条件&&写成了||,提交RE,找了好久的bug。菜是原罪。
第一次写堆的代码。用STL变得好简洁。。。改天看看C版本。