【LeetCode 热题100】 295. 数据流的中位数的算法思路及python代码

最新推荐文章于 2025-04-03 15:29:45 发布

pljnb

最新推荐文章于 2025-04-03 15:29:45 发布

阅读量745

点赞数 14

分类专栏： LeetCode热题100 文章标签：算法 leetcode python

本文链接：https://blog.youkuaiyun.com/pljnb/article/details/146979927

版权

LeetCode热题100 专栏收录该内容

24 篇文章

订阅专栏

295. 数据流的中位数

中位数是有序整数列表中的中间值。如果列表的大小是偶数，则没有中间值，中位数是两个中间值的平均值。

例如 arr = [2,3,4] 的中位数是 3 。
例如 arr = [2,3] 的中位数是 (2 + 3) / 2 = 2.5 。

实现 MedianFinder 类:

MedianFinder() 初始化 MedianFinder 对象。
void addNum(int num) 将数据流中的整数 num 添加到数据结构中。
double findMedian() 返回到目前为止所有元素的中位数。与实际答案相差 $10^{-5}$ 以内的答案将被接受。

示例 1：

输入
["MedianFinder", "addNum", "addNum", "findMedian", "addNum", "findMedian"]
[[], [1], [2], [], [3], []]
输出
[null, null, null, 1.5, null, 2.0]
解释
MedianFinder medianFinder = new MedianFinder();
medianFinder.addNum(1);    // arr = [1]
medianFinder.addNum(2);    // arr = [1, 2]
medianFinder.findMedian(); // 返回 1.5 ((1 + 2) / 2)
medianFinder.addNum(3);    // arr[1, 2, 3]
medianFinder.findMedian(); // return 2.0

算法思路

本文通过 双堆（最大堆 + 最小堆） 维护数据流的中位数，核心思想是将数据分为两部分，较小的一半用最大堆存储（便于快速获取最大值），较大的一半用最小堆存储（便于快速获取最小值）。通过动态调整堆大小，确保中位数可通过堆顶元素快速计算。具体步骤如下：

算法步骤

初始化双堆：
- queMin：最大堆（Python 中通过负数模拟），存储较小的一半数据。
- queMax：最小堆，存储较大的一半数据。
添加元素 addNum：
- 元素插入规则：
  - 若 queMin 为空或新元素 ≤ queMin 堆顶（即当前较小部分的最大值），插入 queMin。
  - 否则插入 queMax。
- 平衡堆大小：
  - queMin 大小最多比 queMax 大 1，若超过则弹出其最大值到 queMax。
  - queMax 大小不能超过 queMin，若超过则弹出其最小值到 queMin。
查找中位数 findMedian：
- 奇数个元素：返回 queMin 堆顶（即较小部分的最大值）。
- 偶数个元素：返回 queMin 堆顶与 queMax 堆顶的平均值。

切入点

堆的性质利用：
- 最大堆维护较小半部分，最小堆维护较大半部分。
- 堆顶元素直接提供中位数计算所需的关键值。
动态平衡：插入时通过堆大小调整，确保中位数快速定位。

关键点

堆的平衡策略：
- 保持 len(queMin) - len(queMax) ∈ {0, 1}，确保中位数始终由 queMin 堆顶决定。
插入方向判断：
根据新元素与 queMin 堆顶的大小关系，决定插入到较小或较大半部分。
负数技巧：
使用负数模拟最大堆，适配 Python 的 heapq 模块（仅支持最小堆）。

复杂度分析

维度	分析
时间复杂度	O(log n)：每次插入涉及堆操作（`heappush` 和 `heappop`），单次操作最坏 O(log n)。
空间复杂度	O(n)：双堆总空间与元素数量 n 成线性关系。

代码逐段解析

import heapq

class MedianFinder:
    def __init__(self):
        self.queMin = []  # 最大堆（存负数）
        self.queMax = []  # 最小堆

    def addNum(self, num: int) -> None:
        queMin_, queMax_ = self.queMin, self.queMax
        
        # 插入较小半部分
        if not queMin_ or num <= -queMin_[0]:
            heapq.heappush(queMin_, -num)
            # 平衡：若较小堆大小超过较大堆+1，转移堆顶到较大堆
            if len(queMax_) + 1 < len(queMin_):
                heapq.heappush(queMax_, -heapq.heappop(queMin_))
        else:
            # 插入较大半部分
            heapq.heappush(queMax_, num)
            # 平衡：若较大堆大小超过较小堆，转移堆顶到较小堆
            if len(queMax_) > len(queMin_):
                heapq.heappush(queMin_, -heapq.heappop(queMax_))
    
    def findMedian(self) -> float:
        queMin_, queMax_ = self.queMin, self.queMax
        # 根据堆大小返回中位数
        if len(queMin_) > len(queMax_):
            return -queMin_[0]
        return (-queMin_[0] + queMax_[0]) / 2