Flink运行时架构及各部署模式下作业提交流程

原创已于 2022-05-12 10:46:09 修改 · 2.2k 阅读

0 ·

CC 4.0 BY-SA版权

hmi1024@163.com

文章标签：

#flink

于 2022-04-20 15:15:54 首次发布

大数据专栏收录该内容

6 篇文章

订阅专栏

本文详细介绍了Apache Flink的运行时架构，包括JobManager、TaskManager和Dispatcher的角色及其交互。JobManager作为作业管理者，负责调度与协调；TaskManager是工作进程，执行实际计算任务；Dispatcher接收并分发作业。作业提交流程中，Client提交作业到Dispatcher，JobMaster解析JobGraph并申请资源，ResourceManager分配TaskManager的slots，最终TaskManager执行任务。此外，文章还对比了独立模式、会话模式和YARN上的作业提交流程。

1.运行时架构

1.1 核心组件

1.1.1 JobManager

作业管理器，对于一个提交执行的作业，JobManager 是真正意义上的“管理者”（Master），负责管理调度，是一个 Flink 集群中任务管理和调度的核心，是控制应用执行的主进程。在不考虑高可用的情况下只能有一个
JobManager ，只有一个是正在运行的领导节点（leader），其他都是备用节点（standby）

JobManager包含三大核心组件：

JobMaster

JobMaster是JobManager的核心组件，负责处理单独的作业（job)
JobMaster和Job是一一对应的，多个Job可以运行在一个Flink集群中，每个Job都有一个自己的JobMaster
在作业提交时，JobMaster会先接收到要执行的应用，一般是由客户端提交来的，包括 Jar包，数据流图（dataflow Graph）和作业图（JobGraph）
jobMaster会将JobGraph转换为一个物理层面的数据流图执行图（ExecutionGraph），它包含所有可以并发执行的任务
JobMaster会向资源管理器ResourceManager发出请求，申请必要的资源，一旦获取到足够的资源，就会将执行图分发到真正运行他们的TaskManager上
在作业的运行过程中，JobMaster会负责所有需要中央协调的操作，比如说检查点（checkpoints）的协调

ResourceManager

注意：该ResourceManager是Flink内置的，不是其他资源调度平台（如YARN）的 ResourceManager

ResourceManager主要负责资源的分配和管理，在Flink集群中只有一个
资源主要指的是TaskManager的槽（task slots），任务槽是Flink集群中的资源调配单元，包含了机器用来计算的一组CPU和内存资源
每一个task都要分配到一个slot上进行
Flink集群Standalone部署模式下，TaskManager是单独启动的（没有Per-Job模式），此时的ResourceManager只能分发可用的TaskManager任务槽，不能单独启动新的TaskManager
Flink集群部署资源管理平台时（YARN 、K8s）等，ResourceManager 会将有空闲槽位的 TaskManager 分配给 JobMaster。若ResourceManager 没有足够的任务槽，它还可以向资源提供平台请求提供启动 TaskManager 进程的容器。另外，ResourceManager 还负责停掉空闲的 TaskManager，释放计算资源

Dispatcher

Dispatcher分发器主要提供一个REST接口，用来提交应用
为每一个新提交的作业启动一个新的JobMaster组件
启动Web UI，方便地展示和监控作业信息
在架构中并不是必须的，在不同的部署模式下可能会被忽略

1.1.2 TaskManager

任务管理器，是Flink中的工作进程，称为Worker

数据流的具体计算由它来完成，每个Flink集群至少一个TaskManager，每一个TaskManager包含一定数量的任务槽（slot），slot是资源调度的最小单位，slot的数量决定了TaskManager并行处理任务的数量
启动后，TaskManager会向ResourceManager注册它的slots，收到ResourceManager的指令后，TaskManager就会将一个或多个slot提供给JobMaster调用，JobMaster就可以分配任务来执行了
在执行过程中，TaskManager 可以缓冲数据，还可以跟其他运行同一应用的 TaskManager交换数据

1.2 作业图

![作业提交及运行流程图](https://img-blog.csdnimg.cn/53060720ff1746fc8eab39b8937c6213.png?x-oss-process=image/watermark,type_d3F5LXplbmhlaQ,shadow_50,text_Q1NETiBAaG1pMTAyNA==,size_20,color_FFFFFF,t_70,g_se,x_16

2. 作业提交流程

2.1 抽象流程

Flink 的提交流程，随着部署模式、资源管理平台的不同，会有不同的变化。首先我们从一个高层级的视角，来做一下抽象提炼，看一看作业提交时宏观上各组件是怎样交互协作的

Flink提交作业抽象流程

Client向Dispatcher提交作业
Dispatcher通过REST接口将作业（包含 JobGraph）提交给 JobMaster
JobMaster将JobGraph解析成可执行的ExecutionGraph得到所需资源的数量，向ResourceManager申请作业所需要的slots
ResourceManager判断当前是否有足够的可用资源，如果没有则启动新的TaskManager
TaskManager启动之后，向ResourceManager注册可用的slot
ResourceManager向TaskManager发出命令，为新作业提供slots
TaskManager向JobMaster提供slots
JobMaster向TaskManager分发任务
TaskManager执行任务，相互之间可以交换数据

2.2 独立模式（Standalone）

在独立模式下，只有两种部署方式会话模式和应用模式，没有分离模式。Flink的三种部署方式
两者整体的作业提交流程十分相似：TaskManager都需要手动启动，JobMaster向ResourceManager申请资源时，ResourceManager会直接要求TaskManager提供资源，区别在于，会话模式下，TaskManager是预先启动的，应用模式的TaskManager是作业提交时启动的

Standalone模式作业提交流程
该作业流程除了ResourceManager不需要启动TaskManager，而是直接向已有的TaskManager要求资源，和上述抽象流程完全一致

2.3 FLINK ON YARN

flink在资源管理平台的作业提交流程，以YARN集群为例

会话模式

需要事先申请资源，如图所示：
FLINK ON YARN会话模式申请资源
这里只启动了 JobManager，在 JobManager 内部，由于还没有提交作业，故只有ResourceManager 和 Dispatcher 在运行，而 TaskManager 可以根据需要动态地启动。如图所示：
在这里插入图片描述

Client提交任务到Dispatcher
Dispatcher启动JobMaster
JobMaster向ResourceManager（Flink）申请slots
ResourceManager（Flink）向ResourceManager（YARN）申请Container资源
ResourceManager（YARN）启动TaskManager
TaskManager向ResourceManager（Flink）注册可用slots
ResourceManager（Flink）向TaskManager请求slots
TakManager向JobMaster提供slots
JobMaster分发任务给TaskManager，TaskManager执行任务

分离模式

在分离模式下，Flink 集群不会预先启动，而是在提交作业时，才启动新的 JobManager。具体流程如图所示：
FLINK ON YARN分离模式作业提交流程

Client提交任务到ResourceManager（YARN）
ResourceManager（YARN）分配Container资源，启动Flink的JobMaster，并将作业提交给JobMaster，此处省略Dispatcher（与会话模式的区别点）
JobMaster向ResourceManager（Flink）请求slots
ResourceManager（Flink）向ResourceManager（YARN）请求Container资源
ResourceManager（YARN）启动新的TaskManager容器
TaskManager向ResourceManager（Flink）注册可用的slots
ResourceManager（Flink）向TaskManager请求slots
TaskManager向JobMaster提供slots
JobMaster分发任务给TaskManager，TaskManager执行任务