力扣295. 数据流的中位数
中位数是有序列表中间的数。如果列表长度是偶数,中位数则是中间两个数的平均值。
例如,
[2,3,4] 的中位数是 3
[2,3] 的中位数是 (2 + 3) / 2 = 2.5
设计一个支持以下两种操作的数据结构:
- void addNum(int num) - 从数据流中添加一个整数到数据结构中。
- double findMedian() - 返回目前所有元素的中位数。
示例:
addNum(1)
addNum(2)
findMedian() -> 1.5
addNum(3)
findMedian() -> 2
进阶:
- 如果数据流中所有整数都在 0 到 100 范围内,你将如何优化你的算法?
- 如果数据流中 99% 的整数都在 0 到 100 范围内,你将如何优化你的算法?
分析
方法1. 直接排序
每次add一个元素时直接插入,获取中位数时直接排序。如果用快排,时间复杂度是O(nlogn)。
方法2. 小顶堆+大顶堆
既然需要快速地找到中位数,我们不妨把数据流进来的每一个都分成两堆。一堆包含一半大的数字,另一堆包含小的数字。
[1,2,3,4] -- [5,8,9,10]
我们可以新建两个堆,一个大顶堆,一个小顶堆。
大顶堆里面存储的是小的那一半数据。如果进来一个新的数据,我们就插入大顶堆,然后取出最大的,放进小顶堆,这样保证了小顶堆的数据永远比大顶堆的数据大。也就实现了O(1)时间复杂度取中位数。因为是在堆中插入,插入的时间复杂度是O(logn)。
代码
class MedianFinder {
//定义大顶堆和小顶堆。
private PriorityQueue<Integer> maxHeap = null;
private PriorityQueue<Integer> minHeap = null;
/** initialize your data structure here. */
public MedianFinder() {
//默认是大顶堆,需要使用lambda表达式将其转化为小顶堆。
this.maxHeap = new PriorityQueue<>((a,b)->b-a);
this.minHeap = new PriorityQueue<>();
}
public void addNum(int num) {
//先将元素放进大顶堆,大顶堆里存储所有的小数字
//堆顶是最大的数字,拿出来放进小顶堆。就实现了小顶堆里数字大。
maxHeap.offer(num);
minHeap.offer(maxHeap.poll());
//保证让大顶堆的数量多一个。
if((maxHeap.size()<minHeap.size())) maxHeap.offer(minHeap.poll());
}
public double findMedian() {
if(maxHeap.size() == minHeap.size()) return (double) (maxHeap.peek()+minHeap.peek())/2;
else return (double)maxHeap.peek();
}
}
/**
* Your MedianFinder object will be instantiated and called as such:
* MedianFinder obj = new MedianFinder();
* obj.addNum(num);
* double param_2 = obj.findMedian();
*/