数据流中的中位数
# -*- coding:utf-8 -*-
from heapq import *
class Solution:
def __init__ (self):
self.maxheap = []
self.minheap = []
def Insert(self, num):
if (len(self.maxheap)+len(self.minheap))&1: #总数为奇数插入最大堆
if len(self.minheap)> 0:
if num > self.minheap[0]:#大于最小堆里的元素
heappush(self.minheap, num)#新数据插入最小堆
heappush(self.maxheap, -self.minheap[0])#最小堆中的最小插入最大堆
heappop(self.minheap)
else:
heappush(self.maxheap, -num)
else:
heappush(self.maxheap, -num)
else: #总数为偶数 插入最小堆
if len(self.maxheap)> 0: #小于最大堆里的元素
if num < -self.maxheap[0]:
heappush(self.maxheap, -num)#新数据插入最大堆
heappush(self.minheap, -self.maxheap[0])#最大堆中的最大元素插入最小堆
heappop(self.maxheap)
else:
heappush(self.minheap, num)
else:
heappush(self.minheap, num)
#print (self.minheap)
def GetMedian(self,n=None):
if (len(self.maxheap)+len(self.minheap))&1:
mid = self.minheap[0]
else:
mid = (self.minheap[0]-self.maxheap[0])/2.0
return mid
本文介绍了一种在数据流中实时计算中位数的高效算法。通过使用两个堆(最大堆和最小堆),该算法能够处理连续输入的数据,并在任意时刻提供当前数据集的中位数。适用于实时数据分析和处理场景。
1149

被折叠的 条评论
为什么被折叠?



