窗口函数(window function)
window function定义了要对窗口中收集的数据做的计算操作
主要分为两类:
增量聚合函数(incremental aggregation functions
- 每条数据到来就进行计算,保持一个简单的状态
- ReduceFunction, AggregateFunction
全窗口函数(full window functions)
- 先把窗口所有数据收集起来,等到计算的时候会遍历所有数据
- ProcessWindowFunction,WindowFunction
其他API
触发器 (.trigger):定义window什么时候关闭,触发计算并输出结果
移除器(.evictor):定义移除某些数据的逻辑
.allowedLateness() :允许处理迟到的数据
.getSideOutput() :获取侧输出流
window API 总览

本文深入解析窗口函数,包括增量聚合函数如ReduceFunction和AggregateFunction,以及全窗口过程WindowFunction。探讨如何利用它们在实时和批处理场景中进行高效数据处理,同时介绍了API如触发器、移除器和数据容错功能。
612

被折叠的 条评论
为什么被折叠?



