295. 数据流的中位数
中位数是有序整数列表中的中间值。如果列表的大小是偶数,则没有中间值,中位数是两个中间值的平均值。
- 例如
arr = [2,3,4]
的中位数是 3 。 - 例如
arr = [2,3]
的中位数是 (2 + 3) / 2 = 2.5 。
实现 MedianFinder 类:
MedianFinder()
初始化MedianFinder
对象。void addNum(int num)
将数据流中的整数num
添加到数据结构中。double findMedian()
返回到目前为止所有元素的中位数。与实际答案相差 1 0 − 5 10^{-5} 10−5 以内的答案将被接受。
示例 1:
输入
["MedianFinder", "addNum", "addNum", "findMedian", "addNum", "findMedian"]
[[], [1], [2], [], [3], []]
输出
[null, null, null, 1.5, null, 2.0]
解释
MedianFinder medianFinder = new MedianFinder();
medianFinder.addNum(1); // arr = [1]
medianFinder.addNum(2); // arr = [1, 2]
medianFinder.findMedian(); // 返回 1.5 ((1 + 2) / 2)
medianFinder.addNum(3); // arr[1, 2, 3]
medianFinder.findMedian(); // return 2.0
算法思路
本文通过 双堆(最大堆 + 最小堆) 维护数据流的中位数,核心思想是将数据分为两部分,较小的一半用最大堆存储(便于快速获取最大值),较大的一半用最小堆存储(便于快速获取最小值)。通过动态调整堆大小,确保中位数可通过堆顶元素快速计算。具体步骤如下:
算法步骤
-
初始化双堆:
queMin
:最大堆(Python 中通过负数模拟),存储较小的一半数据。queMax
:最小堆,存储较大的一半数据。
-
添加元素
addNum
:- 元素插入规则:
- 若
queMin
为空或新元素 ≤queMin
堆顶(即当前较小部分的最大值),插入queMin
。 - 否则插入
queMax
。
- 若
- 平衡堆大小:
queMin
大小最多比queMax
大 1,若超过则弹出其最大值到queMax
。queMax
大小不能超过queMin
,若超过则弹出其最小值到queMin
。
- 元素插入规则:
-
查找中位数
findMedian
:- 奇数个元素:返回
queMin
堆顶(即较小部分的最大值)。 - 偶数个元素:返回
queMin
堆顶与queMax
堆顶的平均值。
- 奇数个元素:返回
切入点
- 堆的性质利用:
- 最大堆维护较小半部分,最小堆维护较大半部分。
- 堆顶元素直接提供中位数计算所需的关键值。
- 动态平衡:插入时通过堆大小调整,确保中位数快速定位。
关键点
- 堆的平衡策略:
- 保持
len(queMin) - len(queMax) ∈ {0, 1}
,确保中位数始终由queMin
堆顶决定。
- 保持
- 插入方向判断:
根据新元素与queMin
堆顶的大小关系,决定插入到较小或较大半部分。 - 负数技巧:
使用负数模拟最大堆,适配 Python 的heapq
模块(仅支持最小堆)。
复杂度分析
维度 | 分析 |
---|---|
时间复杂度 | O(log n):每次插入涉及堆操作(heappush 和 heappop ),单次操作最坏 O(log n)。 |
空间复杂度 | O(n):双堆总空间与元素数量 n 成线性关系。 |
代码逐段解析
import heapq
class MedianFinder:
def __init__(self):
self.queMin = [] # 最大堆(存负数)
self.queMax = [] # 最小堆
def addNum(self, num: int) -> None:
queMin_, queMax_ = self.queMin, self.queMax
# 插入较小半部分
if not queMin_ or num <= -queMin_[0]:
heapq.heappush(queMin_, -num)
# 平衡:若较小堆大小超过较大堆+1,转移堆顶到较大堆
if len(queMax_) + 1 < len(queMin_):
heapq.heappush(queMax_, -heapq.heappop(queMin_))
else:
# 插入较大半部分
heapq.heappush(queMax_, num)
# 平衡:若较大堆大小超过较小堆,转移堆顶到较小堆
if len(queMax_) > len(queMin_):
heapq.heappush(queMin_, -heapq.heappop(queMax_))
def findMedian(self) -> float:
queMin_, queMax_ = self.queMin, self.queMax
# 根据堆大小返回中位数
if len(queMin_) > len(queMax_):
return -queMin_[0]
return (-queMin_[0] + queMax_[0]) / 2