Flink中提供了3个组件,包括DataSource、Transformation和DataSink。
DataSource:表示数据源组件,主要用来接收数据,目前官网提
供了readTextFile、socketTextStream、fromCollection以及一些第三方的Source。
Transformation:表示算子,主要用来对数据进行处理,比如Map、FlatMap、Filter、Reduce、Aggregation等。
DataSink:表示输出组件,主要用来把计算的结果输出到其他存
储介质中,比如writeAsText以及Kafka、Redis、Elasticsearch
等第三方Sink组件。
因此,想要组装一个Flink Job,至少需要这3个组件。
以下来看一个flink的入门程序
首先项目里面引入依赖
<!--flink集成-->
<dependency>
<groupId>org.apache.flink</groupId>
<artifactId>flink-java</artifactId>
<version>1.13.1</version>
</dependency>
<dependency>
<groupId>org.apache.flink</groupId>
<artifactId>flink-streaming-java_2.1