Flink系列-起源及生态组件

最新推荐文章于 2024-07-01 02:25:02 发布

不看白不看，看了不白看

最新推荐文章于 2024-07-01 02:25:02 发布

阅读量393

点赞数

CC 4.0 BY-SA版权

分类专栏： Flink系列文章标签： flink

本文链接：https://blog.youkuaiyun.com/test_test111/article/details/116901294

Flink系列专栏收录该内容

14 篇文章

订阅专栏

Apache Flink是一个分布式流处理框架，起源于柏林工业大学的StratoSphere项目，现为Apache顶级项目。Flink核心在于流处理，支持有界和无界数据流，对比SparkStreaming，其对流式计算支持更强大。Flink拥有DataStream和DataSet API，以及SQL&Table API，支持状态处理。阿里巴巴的Blink是Flink的优化版本，增强了功能和性能。Flink的生态组件包括API、Runtime核心层和物理部署层，提供了一致性和灵活性的分层API设计。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

来源：Flink系列-起源及生态组件

Flink简介

Apache Flink是一个分布式大数据处理引擎，可对有限数据流和无限数据流进行有状态或无状态的计算，能够不上在各种集群环境，对各种规模大小的数据进行快速计算。

Flink 是一个分布式的流处理框架，它能够对有界和无界的数据流进行高效的处理。Flink 的核心是流处理，当然它也能支持批处理，Flink 将批处理看成是流处理的一种特殊情况，即数据流是有明确界限的。

与spark对比，flink和 Spark Streaming 的思想是完全相反的，Spark Streaming 的核心是批处理，它将流处理看成是批处理的一种特殊情况，即把数据流进行极小粒度的拆分，拆分为多个微批处理，并不能完美且高效地处理原生的数据流，因此对流式计算支持的相对较弱。

Flink起源

Apache Flink 诞生于柏林工业大学的一个研究性项目，原名 StratoSphere 。2014 年，由 StratoSphere 项目孵化出 Flink，并于同年捐赠 Apache，之后成为 Apache 的顶级项目。2019 年 1 年，阿里巴巴收购了 Flink 的母公司 Data Artisans，并宣布开源内部的 Blink，Blink 是阿里巴巴基于 Flink 优化后的版本，增加了大量的新功能，并在性能和稳定性上进行了各种优化，经历过阿里内部多种复杂业务的挑战和检验。同时阿里巴巴也表示会逐步将这些新功能和特性 Merge 回社区版本的 Flink 中，因此 Flink 成为目前最为火热的大数据处理框架。

Flink 有界数据流和无界数据流：