yarn出现
yarn是hadoop2.x后出现负责资源调度,它不仅支持mapreduce的计算,还支持hive、spark等计算框架的计算。
yarn组件
yarn包含组件:resourceManager、ApplicationMaster、Container、NodeManager
resourceManager: 负责资源调度,与AM进行通信、与NodeManager进行通信。NodeManager通过心跳机制告知resourceManager自己的资源情况;RM通过RM-AM接口与AM进行通信。
它主要由两个组件构成:调度器(Scheduler)和应用程序管理器(Applications Manager,ASM)。 调度器 调度器根据容量、队列等限制条件(如每个队列分配一定的资源,最多执行一定数量的作业等),将系统中的资源分配给各个正在运行的应用程序。应用程序管理器 应用程序管理器负责管理整个系统中所有应用程序,包括应用程序提交、与调度器协商 资源以启动 ApplicationMaster、监控 ApplicationMaster 运行状态并在失败时重新启动它等。
AM:用户提交的每个应用程序均包含一个 AM,与RM通信获取运行任务的资源,对运行在Container的任务进行资源调度。在任务完成后通知RM,回收资源
Container:真正运行的任务的容器,与AM进行通信,报告AM作业运行情况
NodeManager:每一台机器框架的代理,是执行应用程序的容器,监控应用程序的资源使用情况 (CPU,