
Flink
Flink学习与日常记录
不会飞的小龙人
不积跬步,无以至千里;不积小流,无以成江海
展开
-
Flink 问题之 No Watermark (Watermarks are only available if EventTime is used)
由于下游算子 watermark 的计算方式是取所有不同的上游并行数据源 watermark 的最小值,则其 watermark 将不会发生变化。简单来说,在Flink中kafka连接器会识别每个分片,并为每个分片创建对应Watermark水印,当上游Kafka某个分片在一段时间未发送事件数据,则对应的窗口时间内不会生成Watermark水印,则下游算子(Sink)接收上游的Watermark数据时,是按上游最小Watermark值来计算,则下游算子(Sink)不会发生变化,也就无法触发窗口算子事件;原创 2024-06-06 09:52:49 · 1560 阅读 · 0 评论 -
Flink 系例之 SQL 案例 - 订单统计
示例,对电商实时订单进行聚合计算,分以下两个维度进行:1. 统计每 1 分钟的订单数量、用户数量、销售额、商品数;2. 统计每个分类的订单总数量、用户总数量(未去重)、销售额、商品数原创 2023-03-22 10:55:02 · 2972 阅读 · 1 评论 -
Flink 系例之 SQL 案例 - 游戏上报数据统计
本示例通过模拟上报数据展现玩家在游戏内的登录、退出、创角、升级等事件,从而了解游戏运营动态;玩家进入游戏后,通常游戏内会进行定时事件上报,后台通过上报数据分析不同的游戏热度。通过玩家在游戏内的行为事件,分析游戏内玩家的存活度或游戏粘性;原创 2023-03-22 11:06:59 · 1103 阅读 · 0 评论 -
Flink 系例 之 电商项目 - 购物订单大屏监控实战 (示例)
本章以模拟一个电商平台的日常订单数据统计系统为设计基础,将电商平台的实时订单通过 Flink 实时流计算能力,按聚合维度实时计算,输出订单流计算结果,再通过监控大屏展示,实时快速撑握电商平台订单数据趋势、分类占比、销量排行等,从而全局了解电商平台业务运行状态,为电商平台高层决策、运营、分析、成长等提供最基础、最实时的数据依据。原创 2023-02-21 09:59:09 · 3208 阅读 · 2 评论 -
Flink 系例 之 Dashboard 安装与界面操作
前期入门讲解了需多常用算子、方法、和连接器的使用与代码示例,本文讲解如何安装 Apache Flink Dashboard 平台与界面基本操作。原创 2023-02-21 09:48:55 · 6198 阅读 · 0 评论 -
Flink 系例 之 Checkpoint
Checkpoint 检查点:使 Flink 的状态具有良好的容错性,通过 checkpoint 机制,Flink 可以在 JOB 发生错误时对作业的状态和计算位置进行恢复。原创 2023-02-15 09:56:29 · 399 阅读 · 0 评论 -
Flink 系例 之 GroupBy
GroupBy 算子:基于指定字段分组(类似于 SQL 中的 group by 分组),对数据分组结果进行聚合统计。原创 2023-02-15 09:54:42 · 1460 阅读 · 0 评论 -
Flink 系例 之 Connectors 连接 MySql
通过使用 Flink DataStream Connectors 数据流连接器连接到 Mysql 数据源,并基于 JDBC 提供数据流输入与输出操作;原创 2023-01-31 18:03:44 · 1062 阅读 · 0 评论 -
Flink 系例 之 Connectors 连接 RabbitMq
通过使用 Flink DataStream Connectors 数据流连接器连接到 RabbitMq 消息队列中间件,并提供数据流输入与输出操作;原创 2023-01-31 18:01:27 · 1019 阅读 · 0 评论 -
Flink 系例 之 Connectors 连接 Redis
通过使用 Flink DataStream Connectors 数据流连接器连接到 Redis 缓存数据库,并提供数据流输入与输出操作;原创 2023-01-31 17:59:03 · 1927 阅读 · 0 评论 -
Flink 系例 之 Connectors 读写 csv 文件
通过使用 Flink DataSet Connectors 数据流连接器打开 csv 文件,并提供数据流输入与输出操作原创 2023-01-31 17:56:40 · 934 阅读 · 0 评论 -
Flink 系例 之 Connectors 读写 txt 文件
通过使用 Flink DataSet Connectors 数据流连接器打开 txt 文件,并提供数据流输入与输出操作原创 2022-11-09 11:17:24 · 490 阅读 · 0 评论 -
Flink 系例 之 Connectors 连接 Kafka
通过使用 Flink DataStream Connectors 数据流连接器连接到 ElasticSearch 搜索引擎的文档数据库 Index,并提供数据流输入与输出操作;原创 2022-11-09 11:15:47 · 1409 阅读 · 0 评论 -
Flink 系例 之 Connectors 连接 ElasticSearch
通过使用 Flink DataStream Connectors 数据流连接器连接到 ElasticSearch 搜索引擎的文档数据库 Index,并提供数据流输入与输出操作;原创 2022-07-08 14:30:33 · 1865 阅读 · 1 评论 -
Flink 系例 之 DataStream Connectors 与 示例模块
Flink 为流式 / 批式处理应用程序的开发提供了不同级别的抽象。原创 2022-07-08 14:27:09 · 686 阅读 · 0 评论 -
Flink 系例 之 TableAPI & SQL 与 MYSQL 分组统计
使用 Tbale&SQL 与 Flink JDBC 连接器读取 MYSQL 数据,并用 GROUP BY 语句根据一个或多个列对结果集进行分组。原创 2022-06-29 10:24:13 · 906 阅读 · 0 评论 -
Flink 系例 之 TableAPI & SQL 与 MYSQL 数据查询
使用 Tbale&SQL 与 Flink JDBC 连接器从 MYSQL 数据库表中 SELECT 选取数据。原创 2022-06-29 10:23:14 · 848 阅读 · 0 评论 -
Flink 系例 之 TableAPI & SQL 与 MYSQL 插入数据
使用 Tbale&SQL 与 Flink JDBC 连接器将数据插入 MYSQL 数据库表原创 2022-06-29 10:22:05 · 1270 阅读 · 0 评论 -
Flink 系例 之 TableAPI & SQL 与 Kafka 消息获取
使用 Tbale&SQL 与 Flink Kafka 连接器从 kafka 的消息队列中获取数据原创 2022-06-29 10:20:35 · 720 阅读 · 0 评论 -
Flink 系例 之 TableAPI & SQL 与 Kafka 消息插入
使用 Tbale&SQL 与 Flink Kafka 连接器将数据写入 kafka 的消息队列原创 2022-06-29 10:19:39 · 392 阅读 · 0 评论 -
Flink 系例 之 TableAPI & SQL 与 Elasticsearch
使用 Tbale&SQL 与 Flink Elasticsearch Connector 连接器将数据写入 Elasticsearch 引擎的索引原创 2022-06-13 09:58:01 · 461 阅读 · 0 评论 -
Flink 系例 之 TableAPI & SQL 与 示例模块
Flink 为流式 / 批式处理应用程序的开发提供了不同级别的抽象。原创 2022-06-13 09:52:36 · 703 阅读 · 0 评论 -
Flink 系例 之 SessionWindow
sessionWindows 会话窗口:按不活跃时间切成不同分区窗口,并进行窗口计算原创 2022-06-01 10:20:11 · 401 阅读 · 0 评论 -
Flink 系例 之 TimeWindowAll
timeWindowAll 时间滚动窗口 (不分区时间滚动窗口【滑动窗口与滚动窗口的区别,在于滑动窗口会有数据元素重叠可能,而滚动窗口不存在元素重叠】)原创 2022-06-01 10:19:35 · 1103 阅读 · 0 评论 -
Flink 系例 之 TimeWindow
timeWindow 时间窗口(滑动窗口【滑动窗口与滚动窗口的区别,在于滑动窗口会有数据元素重叠可能,而滚动窗口不存在元素重叠】)原创 2022-06-01 10:18:59 · 531 阅读 · 0 评论 -
Flink 系例 之 CountWindowAll
countWindowAll 数量窗口 (不分区数量滚动窗口【滑动窗口与滚动窗口的区别,在于滑动窗口会有数据元素重叠可能,而滚动窗口不存在元素重叠】)原创 2022-06-01 10:18:26 · 1380 阅读 · 0 评论 -
Flink 系例 之 CountWindow
countWindow 数量窗口(滑动窗口【滑动窗口与滚动窗口的区别,在于滑动窗口会有数据元素重叠可能,而滚动窗口不存在元素重叠】)原创 2022-06-01 10:17:51 · 616 阅读 · 0 评论 -
Flink 系例 之 Watermarks
示例环境示例数据源 (项目码云下载)Flink 系例 之 搭建开发环境与数据TimestampsAndWatermarks.java打印结果参考:Watermark 水印介绍:https://blog.youkuaiyun.com/hlp4207/article/details/90698296官方文档:https://ci.apache.org/projects/flink/flink-docs-release-1.11/dev/event_timestamps_watermarks.html原创 2022-06-01 10:13:54 · 216 阅读 · 0 评论 -
Flink 系例 之 KeyedProcessFunction
示例环境示例数据源 (项目码云下载)Flink 系例 之 搭建开发环境与数据KeyedProcess.java打印结果原创 2022-06-01 10:12:20 · 960 阅读 · 0 评论 -
Flink 系例 之 Sum
sum算子:获取一组数据流中的数值之和示例环境java.version: 1.8.xflink.version: 1.11.1示例数据源(项目码云下载)Flink 系例 之 搭建开发环境与数据Sum.javaimport com.flink.examples.DataSource;import org.apache.flink.api.common.functions.MapFunction;import org.apache.flink.api.common.typ..原创 2022-03-14 20:35:56 · 2155 阅读 · 0 评论 -
Flink 系例 之 MinBy
minBy聚合:获取一组数据流算子中最小的记录行(和min的区别,min是返回计算字段的最小值)示例环境java.version: 1.8.xflink.version: 1.11.1示例数据源(项目码云下载)Flink 系例 之 搭建开发环境与数据MinBy.javaimport com.flink.examples.DataSource;import org.apache.flink.api.common.typeinfo.Types;import org.apa..原创 2022-03-14 20:35:18 · 1524 阅读 · 0 评论 -
Flink 系例 之 Min
min聚合:获取一组数据流中最小的值(和max相反)示例环境java.version: 1.8.xflink.version: 1.11.1示例数据源(项目码云下载)Flink 系例 之 搭建开发环境与数据Min.javaimport com.flink.examples.DataSource;import org.apache.flink.api.common.functions.MapFunction;import org.apache.flink.api.com..原创 2022-03-14 20:34:05 · 152 阅读 · 0 评论 -
Flink 系例 之 Aggregate
Aggregate算子:提供基于事件窗口进行增量计算的函数。(对输入窗口每个数据流元素递增聚合计算,并将窗口状态与窗口内元素保持在累加器中)示例环境java.version: 1.8.xflink.version: 1.11.1示例数据源(项目码云下载)Flink 系例 之 搭建开发环境与数据Aggregate.javaimport com.flink.examples.DataSource;import org.apache.flink.api.common.accu..原创 2022-03-14 20:33:35 · 5121 阅读 · 0 评论 -
Flink 系例 之 MaxBy
maxBy聚合:获取一组数据流算子中最大的记录行(和max的区别,max是返回计算字段的最大值)示例环境java.version: 1.8.xflink.version: 1.11.1示例数据源(项目码云下载)Flink 系例 之 搭建开发环境与数据MaxBy.javaimport com.flink.examples.DataSource;import org.apache.flink.api.common.typeinfo.Types;import org.ap...原创 2022-03-14 20:33:03 · 2857 阅读 · 0 评论 -
Flink 系例 之 Max
max聚合:获取一组数据流中最大的值示例环境java.version: 1.8.xflink.version: 1.11.1示例数据源(项目码云下载)Flink 系例 之 搭建开发环境与数据Max.javaimport com.flink.examples.DataSource;import org.apache.flink.api.common.functions.MapFunction;import org.apache.flink.api.common.type..原创 2022-03-14 20:32:33 · 2173 阅读 · 0 评论 -
Flink 系例 之 Reduce
Reduce算子:对数据流进行滚动聚合计算,并返回每次滚动聚合计算合并后的结果示例环境java.version: 1.8.xflink.version: 1.11.1示例数据源(项目码云下载)Flink 系例 之 搭建开发环境与数据Reduce.javaimport com.flink.examples.DataSource;import org.apache.flink.api.common.functions.ReduceFunction;import org.a..原创 2021-12-13 19:35:40 · 1559 阅读 · 2 评论 -
Flink 系例 之 Process
process算子:处理每个keyBy(分区)输入到窗口的批量数据流(为KeyedStream类型数据流)示例环境java.version: 1.8.xflink.version: 1.11.1示例数据源(项目码云下载)Flink 系例 之 搭建开发环境与数据Process.javaimport com.flink.examples.DataSource;import org.apache.flink.api.java.functions.KeySelector;im..原创 2021-12-13 19:35:09 · 1521 阅读 · 0 评论 -
Flink 系例 之 Apply
Apply算子:对窗口内的数据流进行处理示例环境java.version: 1.8.xflink.version: 1.11.1示例数据源(项目码云下载)Flink 系例 之 搭建开发环境与数据Apply.javaimport com.flink.examples.DataSource;import org.apache.flink.api.java.functions.KeySelector;import org.apache.flink.api.java.tupl..原创 2021-12-13 19:34:34 · 1958 阅读 · 0 评论 -
Flink 系例 之 Connect
Connect算子:功能与union类似,将两个流(union支持两个或以上)合并为一个流,但区别在于connect不要求数据类型一致示例环境java.version: 1.8.xflink.version: 1.11.1示例数据源(项目码云下载)Flink 系例 之 搭建开发环境与数据Connect.javaimport com.flink.examples.DataSource;import org.apache.flink.api.java.tuple.Tuple..原创 2021-12-13 19:34:01 · 1658 阅读 · 0 评论 -
Flink 系例 之 SideOutput
SideOutput方法:(侧输出)从主数据流中根据outputTag获取额外的输出流(分流场景下使用)示例环境java.version: 1.8.xflink.version: 1.11.1示例数据源(项目码云下载)Flink 系例 之 搭建开发环境与数据SideOutput.javaimport com.flink.examples.DataSource;import org.apache.flink.api.java.tuple.Tuple3;import or..原创 2021-12-13 19:33:30 · 635 阅读 · 0 评论