求中位数总结

    今天在某个群中看到有人问在流式的数据中如何动态的维护中位数的方法,因为之前看到同学的一个问题,当时他没答出来。但是后来了解到类似top(k),last(k)需要用到最大堆,最小堆一样,中位数需要利用双堆维护一下。

    先复习一下,如果是静态的数据求取中位数的方法有哪些呢?

    (1)排序          

    (2)fink-k

    这两种方法不太适合于流式的数据动态变更中位数,所以就引出了双堆求取中位数的策略:

    算法如下:

    1、初始化的时候设置两个变量分别记录两个堆【左堆和右堆】的元素的个数。

    2、取第一个元素【d[0]】作为初始中位数m。

    3、循环后面的每一个元素,如果比m大,则插入到右堆,如果比m小,则插入到左堆。

    4、.如果此时最小堆和最大堆的元素个数的差值>=2 ,则将m加入到元素个数少的堆中,然后从元素个数多的堆将根节点赋值到m,最后重建两个最大堆和最小堆,返回到3。

    此时,如果想要知道当前的中位数,输出m即可。

    简单图解一下:

    

转载于:https://www.cnblogs.com/weixliu/p/3946340.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值