Flink源码浅析: Yarn-per-job模式解析TaskManager启动大数据
Flink是一个开源的流式处理框架,广泛应用于大数据处理领域。在Flink中,Yarn-per-job模式是一种常见的部署模式,它允许用户在Yarn集群上启动和管理Flink作业。本文将深入探讨Yarn-per-job模式下TaskManager的启动过程,并结合相应的源代码进行解析。
-
Yarn-per-job模式简介
Yarn-per-job模式是指每个Flink作业都会启动一个独立的Yarn Application Master,并在其上启动一个或多个TaskManager。这种模式的优点是可以更好地隔离不同的作业,提高资源的利用率。 -
TaskManager的启动过程
在Yarn-per-job模式下,TaskManager的启动由Application Master负责。下面是TaskManager启动的主要步骤:
2.1. 创建TaskManagerRunner
在Flink中,TaskManager通过TaskManagerRunner来启动和管理。在Yarn-per-job模式下,Application Master会创建TaskManagerRunner实例,并为其提供必要的配置信息。
TaskManagerRunner runner =
本文深入探讨Flink在Yarn-per-job模式下TaskManager的启动过程,包括TaskManagerRunner的创建与初始化,TaskExecutor线程的启动,TaskManager的注册与任务执行,以及源码解析,帮助理解Flink在Yarn集群的工作机制。
订阅专栏 解锁全文
236

被折叠的 条评论
为什么被折叠?



