系列文章目录
Blink文档阅读笔记(3):aggregation 聚合的语法 group window,over window
文章目录
AGGREGATIONS
blink 支持三种类型(语法)的聚合,分别是 Group Aggregation, Group Window Aggregation, Over Window Aggregation。具体的语法参考文档
https://yuque.antfin-inc.com/rtcompute/doc/sql-query-group-by
https://help.aliyun.com/document_detail/62510.html?spm=a2c4g.11186623.6.770.52a8303dvKHpp3
Group Aggregation
Group Aggregation 是一种在无限流上的聚合,由于没有窗口,是无限大窗口上的聚合,所以计算模式是每到达一条数据就会增量计算一次,并发出更新后的结果。
具体语法和sql的group by没区别,这里不展开说了。
Group Window Aggregation
是一种在窗口上的聚合。区别于上文的 Group Aggregation,Group Window Aggregation 是每个窗口结束发出一条结果数据(无early fire时),有点类似 micro batch。 最常见的是几种时间窗口,如 TUMBLE(滚动窗口), HOP(滑动窗口), SESSION(会话窗口)。例如有用户想统计在过去的1分钟内有多少用户点击了某个的网页。在这种情况下,我们可以定义一个窗口,用来收集最近一分钟内的数据,并对这个窗口内的数据进行计算。
具体语法:
滚动窗口
INSERT INTO tumble_output
SELECT
TUMBLE_START(ts, INTERVAL '1' MINUTE),
TUMBLE_END(ts, INTERVAL '1' MINUTE),
username,
COUNT(click_url)
FROM window_input
GROUP BY TUMBLE(ts, INTERVAL '1' MINUTE), username
滑动窗口
INSERT INTO tumble_output
SELECT
HOP_START(ts, INTERVAL

本文详细介绍了Blink中的聚合操作,包括Group Aggregation、Group Window Aggregation(滚动窗口、滑动窗口、会话窗口)和Over Window Aggregation(Rows over window、Range over window)。通过实例展示了如何在实时大数据处理中应用这些聚合功能进行统计分析。
最低0.47元/天 解锁文章
1496

被折叠的 条评论
为什么被折叠?



