
flink
flink
风筝Lee
儿时,你是父母手中的风筝;上学了,你是老师手中的风筝;工作了,你是领导手中的风筝;成家了,你是妻子手中的风筝;老时,你是子女手中的风筝。人生就像风筝,总有一根线牵着你,或长、或短,或紧、或松;你在这头,爱你的人就在那头。
展开
-
Flink编程基础/基本框架
Flink程序是对数据流,进行各种分布式处理/转换。通过sources创建输入的数据流(可以读取文件,从kafka的topic读取,或者内存的collecitons);结果通过Sinks输出,可以写到本不是文件系统上,或者输出到标准输出。Flink程序可以独立运行,也可以嵌入到其它程序中运行;Flink可以在本机的JVM中执行,也可以提交到多机器的集群上执行。Flink程序分为批处理和流处理两种,批处理用来处理有限的数据集,流处理用来处理持续的流数据。这两种类型的基本编程模式是类似的,本别使用DataS转载 2020-07-17 23:23:21 · 433 阅读 · 0 评论 -
Flink 异步I/O
1.为什么需要异步IOflink在做实时处理时,有时候需要和外部数据交互,但是通常情况下这个交互过程是同步的,这样就会产生大量的等待时间;而异步操作可以在单个函数实例中同时处理多个请求,并且同时接收相应。这样等待时间就平均分摊到了多个请求上,大大减少了请求的等待时长,可以提高实时处理的吞吐量。2.使用flink异步IO的先决条件需要所连接的数据库支持异步客户端 在没有异步客户端的情况下,可以通过创建多个客户端并使用线程池处理同步调用来尝试将同步客户端转变为有限的并发客户端3. flink转载 2020-07-17 22:50:07 · 856 阅读 · 0 评论 -
如何分析及处理 Flink 反压
反压(backpressure)是实时计算应用开发中,特别是流式计算中,十分常见的问题。反压意味着数据管道中某个节点成为瓶颈,处理速率跟不上上游发送数据的速率,而需要对上游进行限速。由于实时计算应用通常使用消息队列来进行生产端和消费端的解耦,消费端数据源是 pull-based 的,所以反压通常是从某个节点传导至数据源并降低数据源(比如 Kafka consumer)的摄入速率。关于 Flink 的反压机制,网上已经有不少博客介绍,中文博客推荐这两篇[1][2]。简单来说,Flink 拓扑中每个节点(T转载 2020-07-17 19:34:38 · 2273 阅读 · 0 评论 -
Flink 1.11 Unaligned Checkpoint 解析
作为 Flink 最基础也是最关键的容错机制,Checkpoint 快照机制很好地保证了 Flink 应用从异常状态恢复后的数据准确性。同时 Checkpoint 相关的 metrics 也是诊断 Flink 应用健康状态最为重要的指标,成功且耗时较短的 Checkpoint 表明作业运行状况良好,没有异常或反压。然而,由于 Checkpoint 与反压的耦合,反压反过来也会作用于 Checkpoint,导致 Checkpoint 的种种问题。针对于此,Flink 在 1.11 引入 Unaligned转载 2020-07-17 18:47:07 · 316 阅读 · 0 评论