
Flink
huaishu
这个作者很懒,什么都没留下…
展开
-
Flink与kafka端到端完全一次语义概述
这篇文章改编自2017年Flink Forward柏林的Piotr Nowojski的演讲。您可以在Flink Forward Berlin网站上找到幻灯片和演示文稿。2017年12月发布的Apache Flink 1.4.0为Flink引入了一个重要的流程处理里程碑:一个名为TwoPhaseCommitSinkFunction的新功能(此处为相关的Jira),它提取了两阶段提交协议的通用逻辑...翻译 2019-07-01 18:23:18 · 899 阅读 · 0 评论 -
What is Apache Flink? — Applications(Flink应用程序)
Apache Flink is a framework for stateful computations over unbounded and bounded data streams. Flink provides multiple APIs at different levels of abstraction and offers dedicated libraries for commo...翻译 2019-07-01 15:34:15 · 296 阅读 · 0 评论 -
What is Apache Flink? — Architecture(Flink架构)
Apache Flink is a framework and distributed processing engine for stateful computations overunbounded and boundeddata streams. Flink has been designed to run inall common cluster environments, per...翻译 2019-07-01 14:24:58 · 400 阅读 · 0 评论 -
Apache Flink 零基础入门(二):DataStream API 编程
我们在系列文章第一篇已经为大家介绍了Flink 的基本概念以及安装部署的过程,希望能够帮助读者建立起对 Flink 的初步印象。接下来将进入第二部分,即 Flink 实际开发的相关内容。本文重点介绍 Flink 开发中比较核心的 DataStream API 。我们首先将回顾分布式流处理的一些基本概念,这些概念对于理解实际的 DataStream API 有非常大的作用。然后,我们将详细介绍 ...转载 2019-06-28 10:51:19 · 1225 阅读 · 0 评论 -
深入了解 Flink 网络栈 ——A Deep-Dive into Flink's Network Stack
Flink 的网络栈是组成 flink-runtime 模块的核心组件之一,也是 Flink 作业的核心部分。所有来自 TaskManager 的工作单元(子任务)都通过它来互相连接。你的流式传输数据流都要经过网络栈,所以它对 Flink 作业的性能表现(包括吞吐量和延迟指标)至关重要。与通过 Akka 使用 RPC 的 TaskManager 和 JobManager 之间的协调通道相比,Ta...转载 2019-06-26 12:47:14 · 1290 阅读 · 0 评论 -
Apache Flink 零基础入门(一):基础概念解析
一、Apache Flink 的定义、架构及原理Apache Flink 是一个分布式大数据处理引擎,可对有限数据流和无限数据流进行有状态或无状态的计算,能够部署在各种集群环境,对各种规模大小的数据进行快速计算。1. Flink Application了解 Flink 应用开发需要先理解 Flink 的 Streams、State、Time 等基础处理语义以及 Flink 兼顾灵活性和...转载 2019-06-24 15:11:10 · 6981 阅读 · 0 评论 -
Data Streaming Fault Tolerance 数据流容错
简介Apache Flink提供了一种容错机制,可以持续恢复数据流应用程序的状态。该机制确保即使存在故障,程序的状态最终也只能反映数据流中的每条记录一次。请注意,有一个开关将保证降级至少一次(如下所述)。容错机制连续地绘制分布式流数据流的快照。对于具有小状态的流应用程序,这些快照非常轻量级,可以频繁绘制,而不会对性能产生太大影响。流应用程序的状态存储在可配置的位置(例如主节点或HDFS)。...翻译 2019-07-02 15:34:56 · 354 阅读 · 0 评论