1.1 不同级别的抽象

-
Flink API 最底层的抽象为有状态实时流处理。其抽象实现是 Process Function,并且 Process Function 被 Flink 框架集成到了 DataStream API 中来为我们使用。自由度最高,从而允许程序可以实现复杂计算。
-
Flink API 第二层抽象是 Core APIs。Core APIs 提供的流式 API(Fluent API)为数据处理提供了通用的模块组件,例如各种形式的用户自定义转换(transformations)、联接(joins)、聚合(aggregations)、窗口(windows)和状态(state)操作等。此层 API 中处理的数据类型在每种编程语言中都有其对应的类。
-
Flink API 第三层抽象是 Table API。Table API 是以表(Table)为中心的声明式编程(DSL)API,例如在流式数据场景下,它可以表示一张正在动态改变的表。
表和 DataStream/DataSet 可以进行无缝切换,Flink 允许用户在编写应用程序时将 Table API 与 DataStream/DataSet API 混合使用。 -
Flink API 最顶层抽象是 SQL。这层抽象在语义和程序表达式上都类似于 Table API,但是其程序实现都是 SQL 查询表达式。SQL 抽象与 Table API 抽象之间的关联是非常紧密的,并且 SQL 查询语句可以在 Table API 中定义的表上执行。
1.2 常用DataStream API
flink-demo

本文介绍了Flink API的不同抽象层级,包括Process Function、Core APIs、Table API和SQL。着重讲解了DataStream API的常用操作,如Map、Filter、Flatmap、KeyBy、Reduce/Aggregations、union、旁路输出、窗口(Sliding Windows和Tumbling Windows)以及如何处理EventTime和Watermark,同时提到了RichAsyncFunction用于异步I/O交互。
最低0.47元/天 解锁文章
577

被折叠的 条评论
为什么被折叠?



