Flink使用(一) Streaming API处理有界流

最新推荐文章于 2024-05-10 21:11:09 发布

仰望夜空一万次

最新推荐文章于 2024-05-10 21:11:09 发布

阅读量2.4k

点赞数

分类专栏： Flink 文章标签： flink java 大数据

本文链接：https://blog.youkuaiyun.com/forrest420/article/details/124539664

版权

本文介绍如何在Apache Flink中使用DataStream API以BATCH模式处理数据，包括设置运行模式的方法、BATCH运行的目的，并通过实例演示了从流式处理到汇总输出的变化。重点在于理解BATCH模式在输出完整结果上的应用。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

前提：

目前，Flink版本支持，批流处理使用一套API完成。

即，使用DataStream API既能处理流数据，又能处理批数据（有界流）。

如何使用DataStream API处理数据，并且以BATCH的方式运行呢？

方式一：在程序中指定运行模式（不推荐，调试可以）：

        env.setRuntimeMode(RuntimeExecutionMode.BATCH);

方式二：

提交任务时，使用bin/flink/run -Dexecution.runtime-mode=BATCH 指定BATCH方式运行程序。

使用BATCH方式运行的目的？

我理解是将最终的结果进行输出，而不是获取一条记录后就输出一条结果。

示范例子

例子数据源word.txt,只有三行数据

hello word
hello flink
hello java

正常情况下，使用DataStream API对数据进行流式处理。

package org.galaxy.foundation.core.courses;

import org.apache.flink.api.common.RuntimeExecutionMode;
import org.apache.flink.api.common.typeinfo.Types;
import org.apache.flink.api.java

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

仰望夜空一万次

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

flink使用DataStream API处理有界数据流

东城庞太师

05-25

378

目录主类 pom.xml 运行结果主类 package practice; import org.apache.flink.api.common.functions.FlatMapFunction; import org.apache.flink.api.java.DataSet; import org.apache.flink.api.java.ExecutionEnvironment; import org.apache.flink.api.java.tuple.Tuple2; .

大数据实时分析实战：Flink与Spark Streaming

最新发布

shejizuopin的博客

03-30

855

随着大数据时代的到来，实时数据分析已成为企业获取即时洞察、优化操作和增强用户体验的关键工具。在大数据实时分析领域，Apache Flink和Apache Spark Streaming是两个备受瞩目的流处理框架。本文将结合优快云网站上的相关资源，深入探讨Flink与Spark Streaming在大数据实时分析中的实战技巧，并通过代码示例进行详细分析。Flink：Spark Streaming：1. 环境搭建首先，需要搭建Flink的开发环境。可以通过Maven或Gradle等构建工具来管理项目依赖。以下

参与评论您还未登录，请先登录后发表或查看评论

【尚硅谷Java版】Flink快速上手之有界流处理

junR_980218的博客

06-20

471

【尚硅谷Java版】Flink快速上手之有界流处理

Flink的有界流和无界流

weixin_42796403的博客

03-01

650

Flink的两个小Demo 一、创建maven项目 POM文件中添加需要的依赖: <properties> <flink.version>1.12.0</flink.version> <java.version>1.8</java.version> <scala.binary.version>2.11</scala.binary.version> <slf4j.version>1.

Flink(1.13.0) 有界流处理

GX_0824的博客

10-03

503

***/}}

Flink Streaming (DataStream API) Operators (flink 1.7 文档)

Yore - Home

04-04

348

Application Development /Streaming (DataStream API)/ Operators Operators 算子将一个或多个 DataStreams 转换为新的 DataStream。程序能将多个转换结合成复杂的数据流拓扑。本部分介绍了基本的数据转换操作，应用这些内容后的有效物理分区以及对 Flink operator chaining 的...

flink-streaming-java_2.12-1.14.3-API文档-中文版.zip

06-06

赠送原API文档：flink-streaming-java_2.12-1.14.3-javadoc.jar；赠送源代码：flink-streaming-java_2.12-1.14.3-sources.jar；赠送Maven依赖信息文件：flink-streaming-java_2.12-1.14.3.pom；包含翻译后的API...

flink-streaming-java_2.11-1.13.2-API文档-中文版.zip

06-06

赠送原API文档：flink-streaming-java_2.11-1.13.2-javadoc.jar；赠送源代码：flink-streaming-java_2.11-1.13.2-sources.jar；赠送Maven依赖信息文件：flink-streaming-java_2.11-1.13.2.pom；包含翻译后的API...

Flink流处理API 使用

qq_40001792的博客

12-10

1155

Flink流处理API 使用一、Source 1、以kafka消息队列的数据作为来源 package com.atguigu.day02; import org.apache.flink.api.common.serialization.SimpleStringSchema; import org.apache.flink.streaming.api.datastream.DataStreamSource; import org.apache.flink.streaming.api.environmen

Flink 流处理 API

忄凝^的博客

09-06

463

这里目录标题5、Flink 流处理API5.1、Environment5.2、Source5.3、Transform (Operator)5.3.1. 基本转换算子5.3.2. 键控转换算子5.3.6. 多流转换算子5.3.9. 分布式转换算子5.4、支持的数据类型5.5、UDF函数5.6、富函数5.7、Sink 5、Flink 流处理API Scala 编程中注意的隐式转换 import org.apache.flink.streaming.api.scala._ import org.apac

Flink Stream API实践

大头皮鞋的博客

05-10

2452

Flink Stream API实践

flink DataStream API

yshysh8的博客

07-06

291

一、DataStream方法： split 拆分stream，返回SplitStream，SplitStream定义了select方法，可以根据select方法查询拆分的datastream。 connect合并流，只能连接两个流，两个流类型可以不一致，返回ConnectedStreams，重写了flatMap、keyBy等方法。 union 可以连接多个流，流的类型必须一致返回DataStream。join join(otherStream).where(<KeySelector&g...

Flink四种API处理有界无界流

qq_46411309的博客

07-08

1016

一.DataSet API处理有界数据流 package myflink; import org.apache.flink.api.common.functions.FlatMapFunction; import org.apache.flink.api.java.DataSet; import org.apache.flink.api.java.ExecutionEnvironment; import org.apache.flink.api.java.tuple.Tuple2; import org.

Flink DataStream常用API

RivenDong

03-10

1211

文章目录1. Flink API的抽象级别分析2. Flink DataStream常用API 1. Flink API的抽象级别分析 Flink中提供了4种不同层次的API：低级API：提供了对时间和状态的细粒度控制，简洁性和易用性较差，主要应用在对一些复杂事件的处理逻辑上。核心API：主要提供了针对流数据和离线数据的处理，对低级API进行了一些封装，提供了filter、sum、max、m...

Flink 流处理API

weixin_44966780的博客

03-10

2870

Flink 流处理API Environment getExecutionEnvironment 创建一个执行环境，表示当前执行程序的上下文。如果程序是独立调用的，则此方法返回本地执行环境；如果从命令行客户端调用程序以提交到集群，则此方法返回此集群的执行环境，也就是说， getExecutionEnvironment 会根据查询运行的方式决定返回什么样的运行环境，是最常用的一种创建执行环境的方式。 ExecutionEnvironment env = ExecutionEnvironment.getEx

Flink:DataStream API 开发

07-27

3242

入门案例 Flink 流处理程序的一般流程获取 Flink 流处理执行环境构建 source 数据处理构建 sink 示例编写 Flink 程序，用来统计单词的数量步骤获取 Flink 批处理运行环境构建一个 socket 源使用 flink 操作进行单词统计打印说明：如果 linux 上没有安装 nc 服务 ,使用 yum 安装 yum install -y nc 参考代码 import org.apache.flink.api.java.tu

Flink-有界流与无界流

Li_Jian_Hui_的博客

07-14

4775

什么是有界流和无界流？有界流有定义流的开始，也有定义流的结束。有界流可以在摄取所有数据后再进行计算。有界流所有数据可以被排序，所以并不需要有序摄取。有界流处理通常被称为批处理。有界流，Flink则由一些专为固定大小数据集特殊设计的算法和数据结构进行内部处理，产生了出色的性能。无界流有定义流的开始，但没有定义流的结束。它们会无休止地产生数据。无界流的数据必须持续处理，即数据被摄取后需要立刻处理。我们不能等到所有数据都到达再处理，因为输入是无限的，在任何时候输入都不会完成。处理

Flink学习12：DataStreaming API

hzp666的博客

08-04

411

val dataStream = env.readTextFile(filePath = "C:\\doc\\temp\\1.正行项目介绍.txt")需要代码实现的就3部分，1.数据源 2.转换 3.sink指定输出格式。使用Ubantu系统自带的NC生成一个socket数据源。然后编写代码，监听socket数据。.........

flink教程：flink的有界、无界数据流、流批一体、容错能力等概念

学亮编程手记

08-30

1335

数据流：所有产生的数据都天然带有时间概念，把事件按照时间顺序排列起来，就形成了一个事件流，也被称作数据流。首先必须先明白什么是有界数据和无界数据有界数据，就是在一个确定的时间范围内的数据流，有开始，有结束，一旦确定就不会再改变，一般批处理用来处理有界数据，如上图的 bounded stream。无界数据，就是持续产生的数据流，数据是无限的，有开始，无结束，一般流处理用来处理无界数据。如图 unbounded stream。Flink的设计思想是以流。