题目描述
中位数是有序列表中间的数。如果列表长度是偶数,中位数则是中间两个数的平均值。
例如,
[2,3,4] 的中位数是 3
[2,3] 的中位数是 (2 + 3) / 2 = 2.5
设计一个支持以下两种操作的数据结构:
- void addNum(int num) - 从数据流中添加一个整数到数据结构中。
- double findMedian() - 返回目前所有元素的中位数。
示例:
addNum(1) addNum(2) findMedian() -> 1.5 addNum(3) findMedian() -> 2
进阶:
- 如果数据流中所有整数都在 0 到 100 范围内,你将如何优化你的算法?
- 如果数据流中 99% 的整数都在 0 到 100 范围内,你将如何优化你的算法?
问题分析
创建一个小顶堆和一个大顶堆,小顶堆保存比较大的那一半数,大顶堆保存比较小的那一半数,整个过程中都保证小顶堆的元素数量等于大顶堆的元素数量,或小顶堆比大顶堆多一个元素。当添加数时,先加到小顶堆里,然后将小顶堆的堆顶元素弹出加入到大顶堆里,这样就保证了添加数后,小顶堆中的数仍比大顶堆中的数大。然后判断如果小顶堆的元素数量小于大顶堆的元素数量,就把大顶堆的堆顶元素弹出加入到小顶堆中,这样就保证了小顶堆的元素数量大于等于大顶堆的元素数量。当要返回中位数时,判断如果大顶堆和小顶堆的元素数量相同,那么返回两个堆顶的平均值;如果小顶堆比大顶堆多一个元素,那么返回小顶堆的堆顶元素就是中位数。
代码实现
class MedianFinder {
private:
priority_queue<int> pq_max;
priority_queue<int, vector<int>, greater<int>> pq_min;
public:
/** initialize your data structure here. */
MedianFinder() {
}
void addNum(int num) {
pq_min.push(num);
pq_max.push(pq_min.top());
pq_min.pop();
if(pq_min.size() < pq_max.size()){
pq_min.push(pq_max.top());
pq_max.pop();
}
}
double findMedian() {
return pq_min.size() == pq_max.size()? 0.5 * (pq_min.top() + pq_max.top()) : pq_min.top();
}
};
/**
* Your MedianFinder object will be instantiated and called as such:
* MedianFinder* obj = new MedianFinder();
* obj->addNum(num);
* double param_2 = obj->findMedian();
*/