flink streamWordCount demo

最新推荐文章于 2024-11-06 09:59:26 发布

原创最新推荐文章于 2024-11-06 09:59:26 发布 · 730 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#flink

flink 专栏收录该内容

3 篇文章

订阅专栏

本文介绍使用Apache Flink进行实时流处理的WordCount应用示例，详细展示了如何设置并行度，从socket接收数据，对数据进行切分、过滤、映射、分组及汇总操作，并最终打印结果。

flink 的 wordCount 流式计算的demo

package com.hbn.wc

import org.apache.flink.api.scala._
import org.apache.flink.streaming.api.scala.{DataStream, StreamExecutionEnvironment}

object StreamWordCount {

  def main(args: Array[String]): Unit = {


    val  env:StreamExecutionEnvironment = StreamExecutionEnvironment.createLocalEnvironment()
    //  并行度
    env.setParallelism(8)

    val inputStream:DataStream[String] = env.socketTextStream("localhost",7777)

    val  result :DataStream[(String,Int)] = inputStream
      .flatMap(_.split(" "))
      .filter( _.nonEmpty)
      .map((_,1))
      .keyBy(0)  //  以  第一个 字段 分组
      .sum(1)   //  以 第二个 字段 求和


    result.print()

    env.execute("stream word  count  job")


  }


}

启动后执行结果如图所示

5> (you,1)
8> (ok,1)
4> (are,1)
6> (how,1)
5> (you,2)
4> (are,2)
5> (fine,1)
3> (hello,1)
7> (flink,1)
3> (hello,2)
2> (saprk,1)
3> (hello,3)

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

H.King

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

Flink学习笔记 --- 理解DataStream WordCount

杨鑫newlife的专栏

07-20

1056

Flink学习笔记 --- 理解DataStream WordCount

Flink实现WordCount（实操详细步骤）

bboy枫亭的博客

08-10

7855

本文使用 Flink 的两种方式实现 WordCount 基于流计算基于批计算文章目录1. Idea 新建 Maven 项目并配置以下依赖2. 实现代码及详细注释2.1 Flink 基于流计算实现 WordCount2.2 Flink 基于批计算实现 WordCount2.3 附件：完整代码先说一下我的环境： Flink 1.9 开发工具：Idea Maven版本：3.3.9 Linux：CentOS 7 演示语言：Scala 2.11 1. Idea 新建 Maven 项目并配置以下依赖 &lt

参与评论您还未登录，请先登录后发表或查看评论

Flink系列---Flink流处理WordCount

Mr.Cao

03-12

2076

FlinkStream的WordCount案例这篇直接贴上案例，关于理论方面，我会选文章专门将Flink的运行流程、架构、原理、流处理、批处理的理论。代码结构类型：maven的module 该处是DTFlinkStreaming 项目结构图 pom文件 <?xml version="1.0" encoding="UTF-8"?> <project xmlns...

flink windows的wordcount demo(离线和实时)

zhang5324496的博客

03-04

504

1.新建maven项目，pom文件新增如下代码 <dependencies> <dependency> <groupId>org.apache.flink</groupId> <artifactId>flink-java</artifactId> <version>1.7.2</version> </dependency>

Flink官方例子解析：WordCount

修破立生

01-31

2249

今天介绍的是官方子项目flink-examples-streaming里面的WordCount例子。WordCount ，中文：单词统计，是大数据计算常用的例子。

flink_WordCount、StreamWordCount

qq_39128254的博客

02-23

349

pom.xml 配置文件 <?xml version="1.0" encoding="UTF-8"?> <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apach

flink 流式处理 wordcount

张俊杰的博客

06-05

431

import org.apache.flink.api.java.utils.ParameterTool import org.apache.flink.streaming.api.scala._ // 流处理 word count object StreamWordCount { def main(args: Array[String]): Unit = { // 创建流处理执行环境, val env: StreamExecutionEnvironment = StreamExecu

初识Flink与基本Demo代码编写

weixin_72525373的博客

11-06

741

关于输出语句乱序与前面数字的疑问，我们要知道，Flink 是一个分布式处理引擎，所以我们的程序应该也是分布式运行的。这段代码不同的运行环境，得到的结果是不同的。需要注意的是，这种代码的实现方式是基于DataSet API的，即我们对数据的处理转换是看作数据集来进行操作的。事实上，Flink本身是流批统一的处理架构，批量的数据集本质上也是流，没必要用两套不同的API来实现。在实际的生产环境中，真正的数据流其实是无界的，有开始没有结束，这就需要我们保持一个监听事件的状态，持续地处理捕获的数据。

【flink基础demo wordcount部署在集群上运行】

weixin_45273750的博客

12-24

1640

flink 1 基础上手 1.1 构建maven工程 1.1.1 引入依赖 <?xml version="1.0" encoding="UTF-8"?> <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://maven.apache.org/POM

flink-wordcount-demo01-1.0-SNAPSHOT.jar

10-29

flink wordcount 测试程序，包含流处理和批处理无界流处理测试启动类：org.flink.study.practice01.StreamWordCount 启动参数：--isNetcat true --host 192.168.116.10 --port 9999

Flink-搭建maven工程FlinkDemo

weixin_44085996的博客

10-11

469

1 .搭建 maven 工程 FlinkDemo 1.1 pom 文件 <?xml version="1.0" encoding="UTF-8"?> <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://maven.apache.org/PO

flink+kafka实现wordcount实时计算+错误解决方案

xiaoyutongxue6的博客

03-28

734

1. Flink Flink介绍： Flink 是一个针对流数据和批数据的分布式处理引擎。它主要是由 Java 代码实现。目前主要还是依靠开源社区的贡献而发展。对 Flink 而言，其所要处理的主要场景就是流数据，批数据只是流数据的一个极限特例而已。再换句话说，Flink 会把所有任务当成流来处理，这也是其最大的特点。Flink 可以支持本地的快速迭代，以及一些环形的迭代任务。 Flink的...

WordCount.jar

08-07

flink1.9版本自带的wordcount例子，位于flink-1.9.0\examples\streaming目录下

Flink Word Count Stream Demo

我的博客

11-03

589

Flink流处理Word Count示例代码。

Flink 简单的 WordCount 小demo

qq_27896233的博客

03-06

260

Flink flastmap

【Flink入门】Flink流处理WordCount

fuyun6363的博客

01-14

457

目录先引入pom.xml文件flink流处理代码IDEA执行前面已经学习了flink的批处理WordCount，现在来学习下flink的流处理WordCount，其实和批处理差不多，区别在于获取执行环境方法和接收的数据方式不一样。批处理通过ExecutionEnvironment.getExecutionEnvironment方法获取批处理执行环境，再通过readTextFile("inputParth")方法获取文件，流处理通过StreamExecutionEnvironment.getExecuti

Flink：Streaming+Batch 完成WordCount

简单随风的博客

08-30

466

我们通过socket实时产生一些单词，使用flink实时接收数据，对指定时间窗口内(例如:2秒)的数据进行聚合统计，并且把时间窗口内计算的结果打印出来 Scala版本 import org.apache.flink.streaming.api.scala.StreamExecutionEnvironment import org.apache.flink.streaming.api.windowing.time.Time object SocketWindowWordCountScala { d

Flink流计算WordCount代码示例

学亮编程手记

09-13

1262

代码 package com.zxl.flink import org.apache.flink.streaming.api.scala.StreamExecutionEnvironment /** * flink的流计算的WordCount */ object FlinkStreamWordCount { def main(args: Array[String]): Unit = { //1、初始化Flink流计算的环境 val streamEnv: StreamExecut

SparkStreaming wordCountDemo基础案例

07-22

190

体现sparkStreaming的秒级准实时性，所以我们需要一个能够持续输入数据的东东 1.CentOS上下载nc 创建一个scala工程,导入相关pom依赖 <?xml version="1.0" encoding="UTF-8"?> <project xmlns="http://maven.apache.org/POM/4.0.0" ...

flink的demo