大数据技术派
待我代码写成,便娶你为妻。
展开
-
Flink状态容错savepoint与checkpoint
本文目录CheckpointsState BackendsSavepointsCheckpoints 与 Savepoints区别Flink可以保证exactly once,与其容错机制checkpoint和savepoint分不开的。本文主要讲解两者的机制与使用,同时会对比两者的区别。CheckpointsCheckpoint 使 Flink 的状态具有良好的容错性,通过 checkpoint ...原创 2024-01-02 09:52:11 · 1418 阅读 · 0 评论 -
Flink异步IO
本文讲解 Flink 用于访问外部数据存储的异步 I/O API。对于不熟悉异步或者事件驱动编程的用户,建议先储备一些关于 Future 和事件驱动编程的知识。本文代码gitee地址:https://gitee.com/ddxygq/BigDataTechnical/blob/main/Flink/src/main/java/operator/AsyncIODemo.java对于异步 I/O 操作...原创 2024-01-10 16:46:49 · 768 阅读 · 0 评论 -
Flink SQL管理平台flink-streaming-platform-web安装搭建
文章都在个人博客网站:https://www.ikeguang.com/ 同步,欢迎访问。最近看到有人在用flink sql的页面管理平台,大致看了下,尝试安装使用,比原生的flink sql界面确实好用多了,我们看下原生的,通过bin/sql-client.sh命令进入那个黑框,一只松鼠,对,就是那个界面。。。。这个工具不是Flink官方出的,是一个国内的小伙伴写的,Github地址:是不是觉得很强大,很多同学已经摩拳擦掌想试试了。原创 2022-12-02 09:51:18 · 892 阅读 · 0 评论 -
Flink同步Kafka数据到ClickHouse分布式表
ClickHouse是一个用于联机分析(OLAP)的列式数据库管理系统(DBMS)。列式数据库更适合于OLAP场景(对于大多数查询而言,处理速度至少提高了100倍),下面详细解释了原因(通过图片更有利于直观理解),图片来源于ClickHouse中文官方文档。行式列式我们使用Flink编写程序,消费kafka里面的主题数据,清洗、归一,写入到clickhouse里面去。原创 2022-12-01 09:42:23 · 570 阅读 · 1 评论 -
flink-cdc实时增量同步mysql数据到hbase
CDC是(Change Data Capture 变更数据获取)的简称。核心思想是,监测并捕获数据库的变动(包括数据 或 数据表的插入INSERT、更新UPDATE、删除DELETE等),将这些变更按发生的顺序完整记录下来,写入到消息中间件中以供其他服务进行订阅及消费。原创 2022-09-16 15:39:49 · 1947 阅读 · 0 评论 -
flink-cdc实时增量同步mysql数据到hive
CDC是(Change Data Capture 变更数据获取)的简称。核心思想是,监测并捕获数据库的变动(包括数据 或 数据表的插入INSERT、更新UPDATE、删除DELETE等),将这些变更按发生的顺序完整记录下来,写入到消息中间件中以供其他服务进行订阅及消费。原创 2022-09-16 14:23:03 · 2924 阅读 · 3 评论 -
flink-cdc实时增量同步mysql数据到kafka
CDC是(Change Data Capture 变更数据获取)的简称。核心思想是,监测并捕获数据库的变动(包括数据 或 数据表的插入INSERT、更新UPDATE、删除DELETE等),将这些变更按发生的顺序完整记录下来,写入到消息中间件中以供其他服务进行订阅及消费。原创 2022-09-14 18:34:56 · 3140 阅读 · 0 评论 -
flink-cdc实时增量同步mysql数据到elasticsearch
CDC是(Change Data Capture 变更数据获取)的简称。核心思想是,监测并捕获数据库的变动(包括数据 或 数据表的插入INSERT、更新UPDATE、删除DELETE等),将这些变更按发生的顺序完整记录下来,写入到消息中间件中以供其他服务进行订阅及消费。原创 2022-09-13 17:45:45 · 2522 阅读 · 1 评论 -
Flink计算pv和uv的通用方法
PV(访问量):即Page View, 即页面浏览量或点击量,用户每次刷新即被计算一次。UV(独立访客):即Unique Visitor,访问您网站的一台电脑客户端为一个访客。00:00-...原创 2021-11-01 08:30:00 · 6431 阅读 · 14 评论 -
第01讲:Flink 的应用场景和架构模型
你好,欢迎来到第 01 课时,本课时我们主要介绍 Flink 的应用场景和架构模型。实时计算最好的时代在过去的十年里,面向数据时代的实时计算技术接踵而至。从我们最初认识的 Storm,再到 Spark 的异军突起,迅速占领了整个实时计算领域。直到 2019 年 1 月底,阿里巴巴内部版本 Flink 正式开源!一石激起千层浪,Flink 开源的消息立刻刷爆朋友圈,整个大数据计算领域一直以来由 Spark 独领风骚,瞬间成为两强争霸的时代。Apache Flink(以下简称 Flink)以其先进的设计理原创 2022-01-25 22:33:54 · 485 阅读 · 0 评论 -
Flink on Yarn安装
步骤很简单,既然要基于yarn,前提是hadoop已经安装好了,我们选择hadoop集群的一个节点,安装一个flink客户端即可。我们平时提交任务,包括mr、spark任务等,也会去安装一个spark客户端。选择一个节点,这个节点通常会用它提交任务。下载flinkwget http://archive.apache.org/dist/flink/flink-1.13.5/flink-1.13.5-bin-scala_2.11.tgz解压tar -zxvf flink-1.13.5-bin-scal原创 2022-01-14 08:38:59 · 2219 阅读 · 0 评论 -
Flink状态管理与状态一致性(超级详细)
文章目录一、前言二、状态类型2.1、Keyed State2.2、Operator State三、状态横向扩展四、检查点机制4.1、开启检查点 (checkpoint)4.2、保存点机制 (Savepoints)五、状态后端5.1、状态管理器分类5.2、配置方式六、状态一致性6.1、端到端(end-to-end)6.2、Flink+Kafka 实现端到端的 exactly-once语义6.3、Kafka幂等性和事务幂等性事务6.4 两阶段提交协议七、链接文档关注公众号:Java大数据与数据仓库,回复“原创 2021-04-20 22:39:34 · 1263 阅读 · 0 评论 -
Flink实时计算topN热榜
TopN的常见应用场景,最热商品购买量,最高人气作者的阅读量等等。1. 用到的知识点Flink创建kafka数据源;基于 EventTime 处理,如何指定 Watermark;Flink中的Window,滚动(tumbling)窗口与滑动(sliding)窗口;State状态的使用;ProcessFunction 实现 TopN 功能;2. 案例介绍通过用户访问日志,计算最近一段时间平台最活跃的几位用户topN。创建kafka生产者,发送测试数据到kafka;消费kafka数据,原创 2021-03-18 23:36:44 · 1870 阅读 · 1 评论 -
Flink连接kafka,将DataStream转换为Table进行查询操作
Table API是用于流和批处理的统一关系API。 Table API查询可以在批量或流式输入上运行而无需修改。 Table API是SQL语言的超级集合,专门用于与Apache Flink一起使用。 Table API是Scala和Java语言集成API。 Table API查询不是像SQL一样将字符串值指定为SQL,而是在Java或Scala中以嵌入语言的样式定义,并支持自动完成和语法验证等...原创 2019-02-22 23:31:11 · 13025 阅读 · 1 评论 -
Flink的Checkpointing机制
目录先决条件启用和配置检查点选择状态的后端存储(State Backend)迭代式作业中的状态检查点(State Checkpoints in Iterative Jobs)重启策略(Restart Strategies)Flink中的每个function和operator都可以是有状态的(有关详细信息请参阅有状态的运行)。有状态的functions通过处理各个元素/事件来...原创 2019-01-22 21:35:55 · 5373 阅读 · 0 评论 -
Flink Scala API中的类型信息
通过类型清单(manifests) and 类标签功能,Scala对于运行时的类型信息有着非常详细的概念。通常,Scala对象的类型和方法可以访问其泛型参数的类型,因此,Scala程序不会有Java程序那样的类型擦除问题。此外,Scala允许通过Scala的宏在Scala编译器中运行自定义代码,这意味着当你编译针对Flink的Scala API编写的Scala程序时,会执行一些Flink代码。...原创 2019-01-22 21:26:15 · 943 阅读 · 0 评论