Flink源码浅析: Yarn-per-job模式解析TaskManager启动大数据
Flink是一个开源的流式处理框架,广泛应用于大数据处理领域。在Flink中,Yarn-per-job模式是一种常见的部署模式,它允许用户在Yarn集群上启动和管理Flink作业。本文将深入探讨Yarn-per-job模式下TaskManager的启动过程,并结合相应的源代码进行解析。
-
Yarn-per-job模式简介
Yarn-per-job模式是指每个Flink作业都会启动一个独立的Yarn Application Master,并在其上启动一个或多个TaskManager。这种模式的优点是可以更好地隔离不同的作业,提高资源的利用率。 -
TaskManager的启动过程
在Yarn-per-job模式下,TaskManager的启动由Application Master负责。下面是TaskManager启动的主要步骤:
2.1. 创建TaskManagerRunner
在Flink中,TaskManager通过TaskManagerRunner来启动和管理。在Yarn-per-job模式下,Application Master会创建TaskManagerRunner实例,并为其提供必要的配置信息。
TaskManagerRun