Flink
文章平均质量分 80
小梁的Flink专栏啦啦啦啦
欧阳喇嘛
Stay Hungary, Stay Foolish
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Flink 用户电商行为分析项目
Flink 用户电商行为分析文章目录Flink 用户电商行为分析1. 实时统计分析1. 1 热门商品统计1. 2 热门页面统计1. 3 网站uv统计2. 业务流程以及风险控制2. 1 页面广告黑名单过滤2. 2 恶意登陆监控2. 3 订单支付失效监控2. 4 支付实时对账3. 项目地址1. 实时统计分析1. 1 热门商品统计需求描述:每隔5分钟 实时展示1小时内的该网站的热门商品的TopN展示的数据形式:时间窗口信息:NO 1:商品ID+浏览次数1NO 2:商品ID+浏览次数2N原创 2022-01-01 12:51:16 · 1312 阅读 · 0 评论 -
Flink CEP
1.为什么要有Flink CEP如果要处理流与流之间的关系,使用DataStream API 去难去定义流之间的匹配规则,但通过Flink CEP就很方便的定义的规则,过滤匹配符合规则的流。2.什么是Flink CEP定义的一套规则(Patterns),满足规则的流将被输出。类似于正则表达式。3.Flink CEP 使用步骤定义规则(Pattern)模式应用输出流上检测出匹配序列的结果DataStream<Event> input =........// 1.原创 2021-12-26 16:31:08 · 831 阅读 · 0 评论 -
Flink 窗口触发器
窗口触发器1. 为什么要有触发器决定何时触发窗口后续的逻辑执行。每个窗口都有一个默认的触发器,时间窗口默认watermark超过EndTime就触发计算窗口类型触发器触发时机EventTime(Tumblng/Sliding/Session)EventTimeTrigger一旦Watermark没过窗口的EndTime,该窗口触发ProcessingTime(Tumblng/Sliding/Session)ProcessingTimeTrigger一旦系统时间没原创 2021-12-23 15:02:13 · 1679 阅读 · 0 评论 -
Flink SQL 入门和实战
文章目录一.Flink SQL 背景二、Flink SQL Hello_world三、Flink SQL 的语法和算子3.1 Flink SQL 的语法3.1 常用算子3.1.1 滚动窗口语法3.1.2滑动窗口3.1.3 Session Window一.Flink SQL 背景Flink SQL 是 Flink 实时计算为简化计算模型,降低用户使用实时计算门槛而设计的一套符合标准 SQL 语义的开发语言。自 2015 年开始,阿里巴巴开始调研开源流计算引擎,最终决定基于 Flink 打造新一代计算转载 2021-12-16 19:26:46 · 956 阅读 · 0 评论 -
Flink中的状态
1.什么是Flink中的状态可以认为状态就是当前任务的一个本地变量,可以被任务的业务逻辑访问。2.算子状态2.1 什么是算子状态算子状态的作用范围限定为算子任务。这意味着由同一并行任务所处理的所有数据都可以访问到相同的状态,状态对于同一任务而言是共享的。算子状态不能由相同或不同算子的另一个任务访问3.键控状态2.1 什么是监控状态键控状态是根据输入数据流中定义的键(key)来维护和访问的。Flink 为每个键值维护一个状态实例,并将具有相同键的所有数据,都分区到同一个算子原创 2021-12-14 15:20:45 · 1544 阅读 · 0 评论 -
Flink ProcessFucntion
文章目录1.为什么要学习底层 ProcessFuntion API2.Flink提供了哪些 ProcessFuntion1.为什么要学习底层 ProcessFuntion API为了访问时间戳 watermark以及注册定时事件2.Flink提供了哪些 ProcessFuntionProcessFunctionKeyedProcessFunctionCoProcessFunctionProcessJoinFunctionBroadcastProcessFunctionKeyedB原创 2021-12-13 22:51:26 · 1281 阅读 · 0 评论 -
Flink04 --时间语义和 watermark
文章目录1. window 概念1.1 为什么要有窗口1.2 什么叫窗口1.3 开窗的原理2. window 类型2.1 时间窗口2.2 计数窗口3. window API1. window 概念1.1 为什么要有窗口实时流是源源不断的进行处理,为了得到一段流的处理后结果,此时就要把无限流转为有界流,此时Flink引入了窗口的概念。1.2 什么叫窗口实时流上截取的一段流 就叫一个窗口1.3 开窗的原理将流数据发到有限大小的桶中进行分析.例如每小时的数据开窗,8~9的数据原创 2021-12-05 15:49:37 · 1273 阅读 · 0 评论 -
Flink02--任务调度原理
一.Job的提交过程怎么实现并行计算?并行度:一个特定算子的子任务的个数称之为并行度。一般情况下,一个stream的并行度,可以认为是其中所有算子中最大的并行度。在代码中可以自定义算子的并行度 ,这样数据可以分配到三个并行的flatMap的任务中,同时做计算。 var resultDatastream: DataStream[(String, Int)] = inputDataStream //flatMap 任务设置2个并行度 .flatMap(_.spl原创 2020-12-24 20:03:33 · 349 阅读 · 0 评论 -
Flink03--流处理API
一.API分类二.Environment 执行环境val env: ExecutionEnvironment = ExecutionEnvironment.getExecutionEnvironmentval env = StreamExecutionEnvironment.getExecutionEnvironment根据以上方法,自动获取程序的执行环境。如果为:LocalEnvironment:如果程序中没设置并行度,默认为cpu核心数。RemoteEnvironment:集群环境原创 2020-12-24 17:20:26 · 384 阅读 · 0 评论 -
Flink01--简介
文章目录一.Flink 是什么二.Flink的特点三.一.Flink 是什么分布式处理引擎,用于对无界和有界数据流进行状态计算二.Flink的特点低延迟 来一条处理一条,真正意义上的实时处理高吞吐结果的准确性和良好的容错性三....原创 2020-12-15 15:06:53 · 308 阅读 · 2 评论
分享