从此开始记录自己学习Flink的过程,以此作为笔记,反复观看以防忘记。(纯小白一个,渴求批评指正)
Flink的特点
1、事件驱动
(侵权删)
2、基于流
Flink一切基于流数据,离线数据有界的流数据;实时数据是无界的流数据
3、分层API
高层:SQL、Table API ——>简明、方便
中层:DataStream API ——>无界数据、实时
底层:ProcessFunction API ——> 事件、状态、时间,越具体越灵活
与Spark的微批相比,Flink是真正的流处理框架
4、集群部署种类
Session Mode:共享JobManager和TaskManager,所有提交的Job都在一个Runtime中运行
Per-Job Mode:独享JobManager和TaskManager,每个Job单独启动一个Runtime
Application Mode:Application的main()运行在Cluster上而不是在客户端,每个Application对应一 个Runtime,含有多个Job
5、资源管理器部署集群:standalone、Hadoop Yarn、Apache Mesos、Docker、Kubernetes
Flink学习笔记:从入门到精通
这篇博客记录了作者学习Flink的历程,主要介绍了Flink的四大特点:事件驱动、基于流数据处理、分层API(SQL、TableAPI、DataStreamAPI和ProcessFunctionAPI)以及集群部署模式。此外,还提到了Flink与Spark的微批处理区别,并列举了Flink的资源管理器部署选项。适合初学者了解Flink的基本概念和用法。
921

被折叠的 条评论
为什么被折叠?



