leetcode 295 数据流的中位数(最大堆与最小堆)

最新推荐文章于 2025-09-08 15:22:21 发布

原创最新推荐文章于 2025-09-08 15:22:21 发布 · 499 阅读

0 ·

CC 4.0 BY-SA版权

数据结构与算法刷题专栏专栏收录该内容

85 篇文章

订阅专栏

本文介绍了一种处理数据流中动态中位数计算的数据结构。通过维护两个堆，一个最大堆和一个最小堆，该结构能高效地添加新元素并实时计算中位数。适用于数据流中整数范围有限或分布集中的场景优化。

中位数是有序列表中间的数。如果列表长度是偶数，中位数则是中间两个数的平均值。
例如，
[2,3,4] 的中位数是 3
[2,3] 的中位数是 (2 + 3) / 2 = 2.5
设计一个支持以下两种操作的数据结构：
void addNum(int num) - 从数据流中添加一个整数到数据结构中。
double findMedian() - 返回目前所有元素的中位数。
示例：
addNum(1)
addNum(2)
findMedian() -> 1.5
addNum(3)
findMedian() -> 2
进阶:
如果数据流中所有整数都在 0 到 100 范围内，你将如何优化你的算法？
如果数据流中 99% 的整数都在 0 到 100 范围内，你将如何优化你的算法？

思路：
直观的方法：
存储结构使用数组，每次添加元素或者查找中位数时对数组进行排序，再计算结果
时间复杂度：
1、若添加元素时排序，addNum复杂度O(n),findMedian复杂度为O(1)
2.若查询中位数时排序，addNum复杂度为O(1),findMedian复杂度为O(nlogn)
若添加元素或查询中位数是随机的操作，共n次操作，按上述思想，整体复杂度最佳为O(n^2)
另一种思路：巧用堆的性质
动态维护一个最大堆与一个最小堆，最大堆存储一半数据，最小堆存储一般数据，维持最大堆的堆顶比最小堆的堆顶小
添加数据进入堆中的状态
状态1：
最大堆与最小堆元素个数相同
最大堆的堆顶比最小堆的堆顶小
状态2：
最大堆比最小堆多一个元素
如果新元素小于最大堆堆顶，则将最大堆的堆顶push进入最小堆，将最大堆的堆顶移除(pop),将新元素添加至最大堆
如果新元素大于最大堆堆顶，将新元素直接push进入最小堆
状态3：
最大堆比最小堆少一个元素
如果新元素小于最小堆堆顶，将新元素直接push进入最大堆
如果新元素大于最小堆堆顶，将最小堆的堆顶push进入最大堆，将最小堆的堆顶移除，将新元素添加至最小堆。
获取中位数思路
1、最大堆最小堆中的元素个数相同
中位数是最大堆堆顶和最小堆堆顶的平均值
2、最大堆比最小堆多一个元素，则中位数为最大堆堆顶元素
3、最大堆比最小堆少一个元素，则中位数为最小堆堆顶

class MedianFinder {
public:
    /** initialize your data structure here. */
    MedianFinder() {
        
    }
    
    void addNum(int num) {
        if(big_queue.empty()){
            big_queue.push(num);
            //return;
        }
        if(big_queue.size() == small_queue.size()){
            if(num < big_queue.top()){
                big_queue.push(num);
            }
            else{
                small_queue.push(num);
            }
        }
        else if(big_queue.size() > small_queue.size()){
            if(num > big_queue.top()){
                small_queue.push(num);
            }
            else{
                small_queue.push(big_queue.top());
                big_queue.pop();
                big_queue.push(num);
            }
        }
        else if(big_queue.size() < small_queue.size()){
            if(num < small_queue.top()){
                big_queue.push(num);
            }
            else{
                big_queue.push(small_queue.top());
                small_queue.pop();
                small_queue.push(num);
            }
        }
    }
    
    double findMedian() {
        if(big_queue.size() == small_queue.size()){
            return (big_queue.top() + small_queue.top()) / 2;
        }
        else if(big_queue.size() > small_queue.size()){
            return big_queue.top();
        }
        return small_queue.top();
    }
private:
    std::priority_queue<double> big_queue;
    std::priority_queue<double, vector<double>,greater<double>> small_queue;
};