[剑指Offer] 41_数据流中的中位数

本文探讨了在数据流中高效获取中位数的方法,对比了多种数据结构的优劣,如乱序数组、排序数组、二叉搜索树、AVL树及最大堆+最小堆。其中,最大堆+最小堆的方案在插入和查询中位数上表现最优。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

题目

如何得到一个数据流中的中位数?如果数据流中读出奇数个值,那么中位数就是所有
数值排序之后位于中间的数值。如果从数据流中读出偶数个数值,那么中位数就是所有数值
排序后中间两个数的平均值。


思路

关键在于选择合适的数据结构,使得求中位数和插入元素的时间复杂度尽可能小。

  1. 乱序数组:新数据插入数组后方,求中位数时排序。
  2. 排序数组:排序插入数组,中位数返回中间值。
  3. 二叉搜索树:添加属性表示子树的节点数,求中位数即寻找子树节点数为总结点数一半的节点。
  4. AVL树:使左右树节点差保持平衡,根节点就是中位数。
  5. 最大堆+最小堆:用最大堆维护数组中较小的半部分,最小堆维护较大的半部分。奇数时,中位数时最小堆的顶,偶数时,两个堆顶的平均值。
数据结构插入时间复杂度求中位数时间复杂度
乱序数组O(1)O(n)
排序数组O(n)O(1)
二叉搜索树平均O(logn),最差O(n)平均O(logn),最差O(n)
AVL树O(logn)O(1)
最大堆+最小堆O(logn)O(1)

代码

思路5:插入时间复杂度:O(logn),求中位数时间复杂度:O(1)

def stream_median(stream):
    """
    :param stream: list
    :return:None
    """

    from datstru import Heap
    class StreamList(object):
        """
        extended heap data structure
        """

        def __init__(self):
            self.left = Heap() # big top
            self.right = Heap(cmp = lambda x,y:x < y) # small top

        def insert(self, n):
            if len(self) % 2:
                if self.right and n > self.right.top():
                    self.right.insert(n)
                    self.left.insert(self.right.pop())
                else:
                    self.left.insert(n)
            else:
                if self.left and n < self.left.top():
                    self.left.insert(n)
                    self.right.insert(self.left.pop())
                else:
                    self.right.insert(n)
            return

        def get_median(self):
            if len(self) % 2:
                return self.right.top()
            else:
                return (self.left.top() + self.right.top()) / 2

        def __len__(self):
            return len(self.left) + len(self.right)

    con = StreamList()
    for n in stream:
        con.insert(n)
        print(con.get_median())
    return

思考

  1. AVL树没有实现过,下次实现一下。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值