LeetCode 295. 数据流的中位数

本文介绍了一种高效算法,用于处理数据流中的实时中位数计算。通过使用小顶堆和大顶堆,该算法能动态平衡数据分布,确保快速响应新增数据,并准确返回当前数据集的中位数。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

题目描述

中位数是有序列表中间的数。如果列表长度是偶数,中位数则是中间两个数的平均值。

例如,

[2,3,4] 的中位数是 3

[2,3] 的中位数是 (2 + 3) / 2 = 2.5

设计一个支持以下两种操作的数据结构:

  • void addNum(int num) - 从数据流中添加一个整数到数据结构中。
  • double findMedian() - 返回目前所有元素的中位数。

示例:

addNum(1)
addNum(2)
findMedian() -> 1.5
addNum(3) 
findMedian() -> 2

进阶:

  1. 如果数据流中所有整数都在 0 到 100 范围内,你将如何优化你的算法?
  2. 如果数据流中 99% 的整数都在 0 到 100 范围内,你将如何优化你的算法?

问题分析

创建一个小顶堆和一个大顶堆,小顶堆保存比较大的那一半数,大顶堆保存比较小的那一半数,整个过程中都保证小顶堆的元素数量等于大顶堆的元素数量,或小顶堆比大顶堆多一个元素。当添加数时,先加到小顶堆里,然后将小顶堆的堆顶元素弹出加入到大顶堆里,这样就保证了添加数后,小顶堆中的数仍比大顶堆中的数大。然后判断如果小顶堆的元素数量小于大顶堆的元素数量,就把大顶堆的堆顶元素弹出加入到小顶堆中,这样就保证了小顶堆的元素数量大于等于大顶堆的元素数量。当要返回中位数时,判断如果大顶堆和小顶堆的元素数量相同,那么返回两个堆顶的平均值;如果小顶堆比大顶堆多一个元素,那么返回小顶堆的堆顶元素就是中位数。

代码实现

class MedianFinder {
private:
    priority_queue<int> pq_max;
    priority_queue<int, vector<int>, greater<int>> pq_min;
    
public:
    /** initialize your data structure here. */
    MedianFinder() {
        
    }
    
    void addNum(int num) {
        pq_min.push(num);
        pq_max.push(pq_min.top());
        pq_min.pop();
        if(pq_min.size() < pq_max.size()){
            pq_min.push(pq_max.top());
            pq_max.pop();
        }
    }
    
    double findMedian() {
        return pq_min.size() == pq_max.size()? 0.5 * (pq_min.top() + pq_max.top()) : pq_min.top();
    }
};

/**
 * Your MedianFinder object will be instantiated and called as such:
 * MedianFinder* obj = new MedianFinder();
 * obj->addNum(num);
 * double param_2 = obj->findMedian();
 */

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值