LeetCode.295 数据流的中位数

本文介绍如何使用双优先队列(一个按降序存放,一个按升序)来解决LeetCode问题,实现实时数据流中的中位数查找。特别针对奇偶数数据流,通过调整队列策略找到中位数,适用于动态插入和查询场景。

原题
https://leetcode-cn.com/problems/find-median-from-data-stream/
在这里插入图片描述

思路

使用两个优先队列 PriorityQueue
一个用来存储中位数前边的数据,要求从大到小排列,命名为queueMin
一个用来存储中位数后边的数据,要求从小到大排列,命名为queueMax
这样两个queue.peek()用来计算中位数
下面讨论列表的奇偶性

  • 奇数
    • 右边多存储一个元素,也就是queueMin.size() + 1 == queueMax.size()
    • 得到的中位数就是queueMax.peek()
  • 偶数
    • 左边和右边存储的元素数量一致,也就是 queueMin.size() == queueMax.size()
    • 得到的中位数就是(queueMin.peek() + queueMax.peek()) / 2.0

插入元素的时候
queueMax.isEmpty()
num >= queueMax.peek()
就往右边队列queueMax插入数据
其余往左边插入
注意:插入数据的同时还要维护queueMin.size()queueMax.size()
(1)向右边queueMax插入的时候,queueMax.size() > queueMin.size()+1的时候,就要把queueMax.poll()添加到queueMin
(2)向左边queueMin插入的时候,queueMin.size() > queueMax.size()的时候,就要把queueMin.poll()添加到queueMax


题解

package com.ivydad.test;

import java.util.PriorityQueue;

/**
 * @Author: kun.zhang@ivydad.com
 * @Description: TODO
 * @DateTime: 2021/8/27 6:03 下午
 **/
public class MedianFinder {

//    存储中位数前边那一部分,从大到小排列
    PriorityQueue<Integer> queueMin;
//    存储中位数后边那一部分,从小到大排列
    PriorityQueue<Integer> queueMax;

    public MedianFinder() {
        queueMin = new PriorityQueue<>((a,b) -> b-a);
        queueMax = new PriorityQueue<>((a,b) -> a-b);
    }

//    奇数:后段队列多一个
//    偶数:两个队列等长
    public void addNum(int num) {
        if (queueMax.isEmpty() || queueMax.peek() <= num) {
            queueMax.offer(num);
            if (queueMax.size() > queueMin.size() + 1) {
                queueMin.offer(queueMax.poll());
            }
        } else {
            queueMin.offer(num);
            if (queueMin.size() > queueMax.size()) {
                queueMax.offer(queueMin.poll());
            }
        }
    }

    public double findMedian() {
        if (queueMin.size() == queueMax.size()) {
            return (queueMin.peek() + queueMax.peek())/2.0;
        } else {
            return queueMax.peek();
        }
    }

    public static void main(String[] args) {
        MedianFinder medianFinder = new MedianFinder();
        medianFinder.addNum(1);
        medianFinder.addNum(2);
        System.out.println(medianFinder.findMedian());
        medianFinder.addNum(3);
        System.out.println(medianFinder.findMedian());
    }

}

<think>嗯,用户想了解如何用编程方法实现在数据流中计算中位数的算法或代码示例。首先,我需要回忆一下相关的数据结构。通常,处理数据流中位数的方法是使用两个堆:一个最大堆和一个最小堆。最大堆保存较小的一半数,最小堆保存较大的一半数。这样,中位数就可以通过这两个堆的堆顶元素来快速计算。 用户提供的引用内容里提到了LeetCode上的第295题,这正是关于数据流中位数的题目。所以应该参考这个题的解法。根据引用[1]和引用[3],关键点在于维护两个堆的平衡,确保它们的元素数量差不超过1。当元素总数为奇数时,中位数是其中一个堆的堆顶;偶数时则是两个堆顶的平均值。 接下来要考虑具体的实现方法。例如,在Python中可以使用heapq模块,但需要注意的是,heapq默认是最小堆,要实现最大堆的话,可以通过存储负数来实现。每次插入新元素时,需要先判断应该插入哪个堆,并调整两个堆的大小,保持平衡。 用户的问题可能还关心如何处理不同情况下的优化,比如数据范围有限时如何优化,但当前的问题主要是基础实现。所以示例代码应该展示如何用两个堆来动态维护中位数。同时,需要确保代码正确,比如插入元素后的平衡操作,比如当两个堆大小差超过1时进行调整。 另外,用户提供的引用[2]提到如果数据大部分在0-100范围内,可能使用计数排序等方法优化,但基础示例可能不需要涉及这些,先给出通用解法比较好。 最后,需要验证示例代码的正确性。比如,当插入多个数后,findMedian是否能正确返回中位数。例如,测试用例[1,2,3]的中位数是2,而[1,2,3,4]的中位数是2.5。代码应该正确处理这些情况。 可能还需要考虑时间复杂度的分析,插入操作的时间复杂度是O(log n),因为堆的插入和弹出操作都是对数时间。而查找中位数是O(1)时间,这满足了高效处理数据流的需求。 总结步骤:创建两个堆,left最大堆,right最小堆。插入时根据大小选择堆,调整平衡。取中位数时根据总元素数量判断奇偶。</think>### 数据流中位数算法实现 在数据流中实时计算中位数,通常使用**双堆法**(最大堆+最小堆)实现时间复杂度为$O(\log n)$的插入和$O(1)$的查询操作[^3]。 #### 实现步骤 1. **数据结构设计**: - **左堆(最大堆)**:存储数据流中较小的一半元素,堆顶为最大值 - **右堆(最小堆)**:存储数据流中较大的一半元素,堆顶为最小值 - **平衡条件**:$|len(left) - len(right)| \leq 1$ 2. **插入逻辑**: ```python import heapq class MedianFinder: def __init__(self): self.left = [] # 最大堆(用负数存储) self.right = [] # 最小堆 def addNum(self, num: int) -> None: # 初始插入左堆 if not self.left or num <= -self.left[0]: heapq.heappush(self.left, -num) else: heapq.heappush(self.right, num) # 平衡堆大小 if len(self.left) - len(self.right) > 1: val = -heapq.heappop(self.left) heapq.heappush(self.right, val) elif len(self.right) > len(self.left): val = heapq.heappop(self.right) heapq.heappush(self.left, -val) ``` 3. **查询中位数**: ```python def findMedian(self) -> float: if len(self.left) == len(self.right): return (-self.left[0] + self.right[0]) / 2 else: return -self.left[0] ``` #### 算法特性 1. **时间复杂度**: - `addNum()`: $O(\log n)$ - `findMedian()`: $O(1)$ 2. **空间复杂度**: $O(n)$ #### 示例验证 ```python mf = MedianFinder() mf.addNum(1) mf.addNum(2) print(mf.findMedian()) # 输出1.5 mf.addNum(3) print(mf.findMedian()) # 输出2.0 ``` #### 优化场景 当数据分布有特殊规律时可优化: 1. **有限范围**(如0-100):使用计数排序统计频率[^2] 2. **已知分布比例**(如99%在0-100):结合双堆法和桶统计[^2]
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

难过的风景

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值