Flink简述

原创

已于 2022-09-21 08:46:38 修改 · 5k 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#flink #大数据 #spark

于 2022-09-13 15:08:28 首次发布

本文简要介绍了Flink作为一个流处理框架的核心特点，包括其与Spark Streaming的主要区别，如Flink支持事件时间、处理时间和注入时间，以及watermark机制。Flink的架构分为API&Libraries、RunTime核心层和物理部署层，提供了多种部署模式。Flink集群包含JobManager、TaskManager和Client，各自承担调度、计算执行和任务提交的角色。watermark机制用于处理迟到数据，确保流处理的正确性。

简单介绍一下Flink？相比较传统的Spark Streaming 区别？

1、简单介绍一下Flink？

Flink是一个框架和分布式处理引擎，用于处理有界和无界的数据流进行有状态计算，flink还提供了数据分布、容错机制和资源管理等核心功能。

Flink VS Spark

数据处理架构：

Spark是批处理，即使是处理实时数据，在Spark中的说法的微批处理。

Flink 是流处理，处理批数据声明为有界数据流，流处理是处理无界数据流。

运行时架构：

Spark是批计算，将DAG划分成不同的stage，一个完成之后才能计算下一个。

Flink是标准的流执行模式，一个事件在一个节点处理后直接发往下一个节点进行处理

时间机制:

Spark只支持处理时间。

Flink支持事件时间、处理时间、注入时间，同时也支持watermark机制来处理滞后的数据。

Flink的组件栈有哪些？各自的作用？公司的flink集群规模多大？

Flink分层架构，从上到下一次层：API&Libraries、RunTime核心层和物理部署层

Deploy 层：该层主要涉及了Flink的部署模式，在上图中我们可以看出，Flink 支持包括local、Standalone、Cluster、Cloud等多种部署模式。

最低0.47元/天解锁文章

博客等级

码龄4年

3
原创

5
点赞

11
收藏

5
粉丝

关注

私信

热门文章

上一篇：: Kafka 整体架构及概念

下一篇：: Hive===笔记

最新评论

Flink简述
ETLCloud数据集成社区: 文章很用心很详细，感谢博主讲解，我们企业最近新出了ETLCloud数据集成工具，如果是想要快速实现数据库CDC操作，ETLCloud也能实现flink cdc的效果，在增量同步、断点续传、全量同步的表现都很好，也支持全增量一体化同步，欢迎博主去体验下，也可以加入我们的社区，一起交流下，提提不同的建议！！

大家在看

最新文章

目录

展开全部

收起

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。