295. 数据流的中位数

中位数是有序列表中间的数。如果列表长度是偶数,中位数则是中间两个数的平均值。

例如,

[2,3,4] 的中位数是 3

[2,3] 的中位数是 (2 + 3) / 2 = 2.5

设计一个支持以下两种操作的数据结构:

void addNum(int num) - 从数据流中添加一个整数到数据结构中。
double findMedian() - 返回目前所有元素的中位数。

来源:力扣(LeetCode)
链接:https://leetcode-cn.com/problems/find-median-from-data-stream
 

class MedianFinder {
      priority_queue<int> front;
    
    priority_queue<int, vector<int>, greater<int>> back;
    
    // 把数据分为两段,前面的小,后面的大
    // 为了方便把数字从前面移到后面-> 总是移动前面的最大的到后面
    // 为了方便把数字从后面移到前面-> 总是移动后面最小的到前面
    // 所以数据的前半部分用大堆
    // 数据的后半部分用小堆
public:
    /** initialize your data structure here. */
    MedianFinder() {

    }
    
    void addNum(int num) {
        // 我们总是把数字加到前面
        // 如果前面的比后面的多
        // 那么就把前面较大的取出来,放到后面
        front.push(num);
        while (front.size() > back.size()) {
            auto l = front.top();
            front.pop();
            back.push(l);
        }
        
        // 再看一下大小
        // 如果前半部分有数大于后半部分,那么需要交换
        
        if (!front.empty() && !back.empty()) {
            while (back.top() < front.top()) {
                auto f = front.top();
                front.pop();
                auto b = back.top();
                back.pop();
                front.push(b);
                back.push(f);
            }
        }
    }
    
    double findMedian() {
        if (front.size() ==  back.size()) {
            if (!front.empty()) {
                return (double)(front.top() + back.top())/2;
            }else{
                return 0;
            }
        }else{
            return back.empty() ? 0 : back.top();
        }
    }
};

/**
 * Your MedianFinder object will be instantiated and called as such:
 * MedianFinder* obj = new MedianFinder();
 * obj->addNum(num);
 * double param_2 = obj->findMedian();
 */

 

计算数据流中位数可以通过Flink的ProcessFunction来实现。 具体实现步骤如下: 1.数据流按照大小排序 2. 计算数据流的长度,如果是奇数,则中位数为第 (length+1)/2 个元素;如果是偶数,则中位数为第length/2个元素和第(length/2+1)个元素的平均值。 3. 在ProcessFunction的实现中,可以使用状态变量来保存数据流的有序列表,并计算中位数。 以下是一个简单的示例代码: ```java public class MedianFunction extends ProcessFunction<Integer, Double> { private ListState<Integer> values; @Override public void open(Configuration parameters) throws Exception { super.open(parameters); values = getRuntimeContext().getListState(new ListStateDescriptor<Integer>("values", Integer.class)); } @Override public void processElement(Integer value, Context ctx, Collector<Double> out) throws Exception { values.add(value); List<Integer> sortedValues = new ArrayList<>(); for (Integer v : values.get()) { sortedValues.add(v); } Collections.sort(sortedValues); int length = sortedValues.size(); if (length % 2 == 0) { double median = (sortedValues.get(length/2) + sortedValues.get(length/2 - 1)) / 2.0; out.collect(median); } else { double median = sortedValues.get(length/2); out.collect(median); } } } ``` 在上述代码中,我们使用了ListState来保存数据流中的元素,并在每次处理新元素时重新排序并计算中位数。注意,这只是一个简单的示例,实际应用中需要考虑更多的问题,比如数据倾斜、数据丢失等。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值