介绍
Apache Flink是用于分布式流和批处理数据处理的开源平台。 Flink是具有多个API的流数据流引擎,用于创建面向数据流的应用程序。
Flink应用程序通常使用Apache Kafka进行数据输入和输出。 本文将指导您逐步使用Apache Flink和Kafka。
先决条件
- Apache Kafka 0.9.x
- 吉特
- Maven 3.x或更高版本
创建您的Flink流项目
第一步是创建Java应用程序,最简单的方法是使用flink-quickstart-java原型,该原型包含核心依赖关系和打包任务。 本文与Apache Flink快速入门示例相似,重点明确介绍了MapR Streams的数据输入和输出。
在此应用程序中,我们将创建两个作业:
-
WriteToKafka
:生成随机字符串,并使用Kafka Flink连接器及其Producer API将其发布到MapR Streams主题。 -
ReadFromKafka
:读取相同的主题,并使用Kafka Flink连接器及其使用方在标准输出中显示消息。 API。
完整项目可在GitHub上找到:
让我们使用Apache Maven创建项目:
mvn archetype:ge