2021年1月14日09:05:40 数据流的中位数★★★

最新推荐文章于 2021-06-07 13:15:21 发布

原创最新推荐文章于 2021-06-07 13:15:21 发布 · 165 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#队列

牛客网剑指offer 专栏收录该内容

58 篇文章

订阅专栏

博客围绕如何得到数据流中的中位数展开。提到可用排序或自定义compare方法实现，还介绍了更方便的利用大小堆（优先队列）的方法。用Java集合PriorityQueue设置小顶堆和大顶堆，根据数据个数奇偶性插入值，按规则取中位数。

题目描述

**
如何得到一个数据流中的中位数？如果从数据流中读出奇数个数值，那么中位数就是所有数值排序之后位于中间的数值。如果从数据流中读出偶数个数值，那么中位数就是所有数值排序之后中间两个数的平均值。我们使用Insert()方法读取数据流，使用GetMedian()方法获取当前读取数据的中位数。

首先想到的是排序
用任意一种排序肯定都能实现
或者定义一个collection 然后sort 自定义compare方法
参考如下

public static void main(String[] args ) {
ArrayList a = new ArrayList<>();
a .add( “阿玲” );
a .add( “刘德华” );
a .add( “劉德華” );
a .add( “吳為” );
a .add( “吴为” );
a .add( “喵喵” );
Collections. sort ( a , new Comparator() {// Collections是一个在Collection上操作的工具类。可以实现对集合元素的排序
@Override
public int compare(String o1 , String o2 ) {
return Collator. getInstance (Locale. CHINA ).compare( o1 , o2 );// Collator是一个支持简体汉语的比较的抽象类。简单字符串比较可以调用String自带比较方法
}
});
for (String string : a ) {
System. out .println( string );
}
}

还有一种更方便的方法利用大小堆
也就是优先队列
链接：https://www.nowcoder.com/questionTerminal/9be0172896bd43948f8a32fb954e1be1?f=discussion
来源：牛客网

先用java集合PriorityQueue来设置一个小顶堆和大顶堆
主要的思想是：因为要求的是中位数，那么这两个堆，大顶堆用来存较小的数，从大到小排列；
小顶堆存较大的数，从小到大的顺序排序*，显然中位数就是大顶堆的根节点与小顶堆的根节点和的平均数。

⭐保证：小顶堆中的元素都大于等于大顶堆中的元素，所以每次塞值，并不是直接塞进去，而是从另一个堆中poll出一个最大（最小）的塞值
⭐当数目为偶数的时候，将这个值插入大顶堆中，再将大顶堆中根节点（即最大值）插入到小顶堆中；
⭐当数目为奇数的时候，将这个值插入小顶堆中，再讲小顶堆中根节点（即最小值）插入到大顶堆中；
⭐取中位数的时候，如果当前个数为偶数，显然是取小顶堆和大顶堆根结点的平均值；如果当前个数为奇数，显然是取小顶堆的根节点

import java.util.PriorityQueue;
import java.util.Comparator;
public class Solution {
  private PriorityQueue<Integer> minHeap = new PriorityQueue<Integer>();
 
    //大顶堆，用该堆记录位于中位数前面的部分
    private PriorityQueue<Integer> maxHeap = new PriorityQueue<Integer>(15, new Comparator<Integer>() {
        @Override
        public int compare(Integer o1, Integer o2) {
            return o2 - o1;
        }
    });
 
    //记录偶数个还是奇数个
    int count = 0;
    //每次插入小顶堆的是当前大顶堆中最大的数
    //每次插入大顶堆的是当前小顶堆中最小的数
    //这样保证小顶堆中的数永远大于等于大顶堆中的数
    //中位数就可以方便地从两者的根结点中获取了
    //优先队列中的常用方法有：增加元素，删除栈顶，获得栈顶元素，和队列中的几个函数应该是一样的
    //offer peek poll,
    public void Insert(Integer num) {
        //个数为偶数的话，则先插入到大顶堆，然后将大顶堆中最大的数插入小顶堆中
        if(count % 2 == 0){
            maxHeap.offer(num);
            int max = maxHeap.poll();
            minHeap.offer(max);
        }else{
            //个数为奇数的话，则先插入到小顶堆，然后将小顶堆中最小的数插入大顶堆中
            minHeap.offer(num);
            int min = minHeap.poll();
            maxHeap.offer(min);
        }
        count++;
    }
    public Double GetMedian() {
        //当前为偶数个，则取小顶堆和大顶堆的堆顶元素求平均
        if(count % 2 == 0){
            return new Double(minHeap.peek() + maxHeap.peek())/2;
        }else{
            //当前为奇数个，则直接从小顶堆中取元素即可，所以我们要保证小顶堆中的元素的个数。
            return new Double(minHeap.peek());
        }
    }

}