
Flink - 必知必会
文章平均质量分 77
专注大数据Flink流试处理技术。从基础入门、概念、原理、实战、性能调优、源码解析等内容,使用Java开发,同时含有Scala部分核心代码。欢迎关注我的博客及github。
不埋雷的探长
深耕AI、BigData技术,专注于人工智能、大数据技术领域的知识分享。优快云认证博客专家,目前就职于腾讯,内推可私聊~ 热爱软件,喜欢编程的阳光小伙子~ 技术驱动智能边界,持续突破认知极限~
展开
-
Flink 通过开源中间件,写数据到ClickHouse
目录一、添加maven依赖二、编写Java Bean实体类三、输入数据,启动Flink 应用四、在ClickHouse 验证数据是否写入成功一、添加maven依赖 <dependency> <groupId>ru.ivi.opensource</groupId> <artifactId>flink-clickhouse-sink</artifactId>原创 2021-01-03 16:18:40 · 1711 阅读 · 6 评论 -
Flink 写数据到ClickHouse
目录一、导入clickhouse jdbc 依赖二、编写 Flink 写入ClickHouse代码三、创建ClickHouse 表四、运行向localhost,7777端口发送数据,并启动Flink应用程序五、查询ClickHouse 数据结果,验证数据是否写入成功一、导入clickhouse jdbc 依赖 <!-- 写入数据到clickhouse --> <dependency> <g.原创 2021-01-03 15:03:20 · 13300 阅读 · 12 评论 -
Flink —— 容错性机制- 屏障(barrier)实现原理
我们知道Flink提供了容错机制,能够在应用失败的时候重新恢复任务。这个机制主要就是通过持续产生快照的方式实现的。Flink快照主要包括两部分数据一部分是数据流的数据,另一部分是operator的状态数据。对应的快照机制的实现有主要两个部分组成,一个是屏障(Barrier),一个是状态(State)。因为Flink这里处理的数据流,数据在多个operator的DAG拓扑中持续流动,要想实现某个时刻快照可以用于系统故障恢复,必须保证这个快照,完全能够确定某一个时刻状态,这个时刻之前的数据全部处理完,之后的数据原创 2020-09-23 22:38:40 · 1262 阅读 · 3 评论 -
Flink 学习链接 —— 都是干货
Flink 学习链接 —— 都是干货麻烦路过的各位亲给这个项目点个 【star】,太不易了,写了这么多,算是对我坚持下来的一种鼓励吧!FlinkTutorial 专注大数据Flink流试处理技术从数据流向角度分析:数据源Source、转换操作Transformation、下沉Sink从窗口操作角度分析:countWindowAll、countWindow、timeWindowAll、timeWindow滑动窗口从实际项目角度分析:与kafka、mysql、redis、http、elasti原创 2020-09-14 20:27:50 · 439 阅读 · 5 评论 -
Flink —— 什么是Flink?
Flink —— 什么是Flink?Apache Flink- 有状态人数据流分布式计算引擎。什么是流处理?在自然环境中,数据的产生原本就是流式的。无论是来自 Web 服务器的事件数据,证券交易所的交易数据,还是来自工厂车间机器上的传感器数据,其数据都是流式的。但是当你分析数据时,可以围绕有界流(bounded)或无界流(unbounded)两种模型来组织处理数据,当然,选择不同的模型,程序的执行和处理方式也都会不同。批处理 是有界数据流处理的范例。在这种模式下,你可以选择在计算...原创 2020-09-14 09:13:54 · 4759 阅读 · 1 评论 -
Flink —— StateBackend 状态后端
在启动 CheckPoint 机制时,状态会随着 CheckPoint 而持久化,以防止数据丢失、保障恢复时的一致性。 状态内部的存储格式、状态在 CheckPoint 时如何持久化以及持久化在哪里均取决于选择的State Backend。一、可用的 State BackendsFlink 内置了以下这些开箱即用的 state backends :MemoryStateBackend FsStateBackend RocksDBStateBackend如果不设置,默认使用 MemoryS.原创 2020-09-07 22:40:20 · 4072 阅读 · 5 评论 -
Flink实战 —— 读取Kafka数据并与MySQL数据关联【附源码】
需要导入mysql驱动 <dependency> <groupId>mysql</groupId> <artifactId>mysql-connector-java</artifactId> <version>5.1.44</version> </dependency>mysql建立表及插入数据D原创 2020-09-02 23:03:24 · 2920 阅读 · 4 评论 -
Flink 相关的深度技术博客链接
Flink相关的深度技术博客链接超全干货--Flink思维导图,花了3周左右编写、校对 大解密:Flink恰巧语义一次消费,怎么保证 Flink 容错机制 —— CheckPoint【含示例源码】文章最后,给大家推荐一些受欢迎的技术博客链接:Flinak 相关技术博客链接 Hadoop相关技术博客链接 Spark核心技术链接 JAVA相关的深度技术博客链接 超全干货--Flink思维导图,花了3周左右编写、校对 深入JAVA 的JVM核心原理解决线上各种故障【附案例】 请...原创 2020-08-24 23:50:16 · 1499 阅读 · 2 评论 -
Flink 容错机制 —— CheckPoint【含示例源码】
一、Flink 容错1.1 State 状态Flink 实时计算程序为了保证计算过程中,出现异常可以容易,就要将中间的计算结果数据存储起来,如果不保存中间结果那么需要重新计算效率就非常低下,这些中间数据就叫做State。State 可以是多种类型的,默认是保存在 JobManager 的内存中,也可以保存到 TaskManager 本地文件系统或HDFS 这样的分布式文件系统。1.2 StateBackEnd用来保存 State 的存储后端就叫做 StateBackEnd。默认是保存在原创 2020-08-24 23:29:35 · 1800 阅读 · 0 评论 -
大解密:Flink恰巧语义一次消费,怎么保证?
我们都知道Flink在流式处理上性能强大,且很好地支持ExactlyOnce语义;且这也是Flink核心的技术点,所以成为面试官喜欢追问的一个话题:Flink恰巧语义一次消费,怎么保证? 在这个思维导图进行了详细的描述及说明。欢迎阅读及下载超全干货--Flink思维导图,花了3周左右编写、校对。下载链接:Flink_思维导图(干货).xmind.zip上述思维导图中也进行了详细地描述:Flink_思维导图(干货).xmind.zip截图如下:如果面试官问到,可以大致从这些方面...原创 2020-07-19 08:12:49 · 1741 阅读 · 0 评论 -
超全干货--Flink思维导图,花了3周左右编写、校对
在流式分布式计算领域中,Flink可以和Spark Streaming、Storm叫板了。从我的使用流式情况来看,Flink在流式处理这块完全可以代替其他的框架了。Flink技术点多,容易忘记,为此专门整理了Flink思维导图。方便记忆。超级干货--Flink思维导图,花了3周左右编写、校对。下载链接:Flink_思维导图(干货).xmind.zip以下是我自己整理的Flink相关笔记,同时与主流的Spark Streaming进行类比:JobManager,相当于Spark 中的Appl原创 2020-07-18 11:59:35 · 5492 阅读 · 12 评论