Flink快速入门-3.流处理之基础算子

原创

于 2025-02-08 14:20:37 发布 · 1k 阅读

·

10

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#flink #大数据

流处理之基础算子

实验介绍

上一节实验中我们学习了 Flink 的集群部署，从本节开始我们将正式进入 Flink API 的学习。本节的主要内容是 Flink 流处理的基本流程和三个基础算子。

知识点

流处理流程
基础算子
- map
- filter
- flatMap

流处理流程

不仅仅是 Flink，其实不论是流处理还是批处理框架，总的来说都有以下这么⼏个流程：获取数据、对数据进行 ETL 转换，输出转换之后的结果。如果再细分的话，结合我们在第一个实验中的 WordCount 代码，可以将 Flink 流处理分为以下几个过程：

设置执行环境（Environment）
获取输入流（Source）
转换操作（Transform）
输出结果（Sink）
执行（Execute）

设置输入环境和执行是比较简单的，重点是 Source、Transform 和 Sink。在 Source 阶段，我们可以从内存对象中创建，也可以从文件以及 Kafka 等外部数据源中获取，还可以根据 Flink 提供的 API 自定义 Source。在 Sink 阶段，我们可以将计算的结果输出到控制台、文件、数据库或者下游的 Kafka，也可以根据 Flink 提供的 API 自定义 Sink。我们本节以及接下来的两个实验介绍的内容都是属于 Transform 阶段的，关于 Source 和 Sink 我们会在后面专门的实验中进行介绍。

基础算子

Flink 中的三个基础算子 map、fil

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。