《剑指offer》-数据流中的中位数

本文介绍了一种高效计算数据流中位数的方法,利用两个堆(最大堆和最小堆)来实现动态平衡,确保在不断接收新数据时能够快速找到当前数据集的中位数。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

如何得到一个数据流中的中位数?如果从数据流中读出奇数个数值,那么中位数就是所有数值排序之后位于中间的数值。如果从数据流中读出偶数个数值,那么中位数就是所有数值排序之后中间两个数的平均值。

最开始的思路就是用map或者set存储。习惯写python就想直接用median的key去访问median,但是C++ STL的map或者set没有key这个东西,如果用迭代器那么访问元素复杂度是O(n)

看到很多解法是用两个堆来做,一个最大堆,一个最小堆,一开始不理解。后来发现这样的好处是把数据总体切分为两部分,一部分(最大堆)所有元素都比另一部分(最小堆)小。然后当有新元素需要insert的时候,根据现有元素总数奇偶,决定先压入哪个堆,然后弹出一个元素,弹出元素放入另一个堆。

最后的答案处理,根据元素总数奇偶,决定从两个堆分别取还是从特定的那个取。

class Solution{
public:
    void Insert(int num){
        if (maxS.size() == minS.size()){
            maxS.insert(num);
            minS.insert(*maxS.begin());
            maxS.erase(maxS.begin());
        }
        else{
            minS.insert(num);
            maxS.insert(*minS.begin());
            minS.erase(minS.begin());
        }
    }

    double GetMedian(){
        int num = maxS.size() + minS.size();
        
        double median;
        if ((num&1)==1){
            median = *minS.begin();
        }
        else{
            median = (*maxS.begin() + *minS.begin()) / 2.0;
        }
        return median;
    }
private:
    multiset<int, greater<int> > maxS;
    multiset<int, less<int> > minS;
};
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值