Apache Flink 是一个分布式流和批处理的开源平台。
Flink’s core 是一个流数据引擎,它针对流数据,提供了数据分布,通信和容错,的分布式计算能力。
Flink 包含如下几种不同API,用来创建不同的应用
- DataSet API for 静态数据 嵌入到 Java, Scala, and Python,
- DataStream API for 流数据 嵌入到 in Java and Scala, and
- Table API with 类SQL的表达式语言 embedded in Java and Scala.
Flink 也包库特定于域的用例:
- Machine Learning library, 机器学习
- Gelly, 图计算
你可以轻松地把Flink的数据的输入和输出,整合到其他著名的开源项目,包括系统部署。
