YARN
Hadoop1.x版本中最大的问题是资源问题
对数据的处理和资源调度主要依赖MapReduce完成,只能运行MapReduce程序
JobTracker负责资源管理和程序调度,压力较大
Hadoop2.x版本添加YARN
主要负责集群资源管理
YARN概述
YARN(Yet Another Resource Negotiator)核心思想是将资源管理和任务的监控和调度分离
通用的资源管理系统,可为不同的应用(MapReduce、Spark、Flink等)提供统一的资源管理和调度
它的引入为集群在利用率、资源统一管理和数据共享等方面带来了巨大好处
YARN的基本架构核心组件
YARN的架构是master/slaves的主从架构
master:ResourceManager->全局资源管理
负责集群全局统一的资源管理、调度、分配
slave:NodeMannager->结点资源管理器
启动了NodeManager进程的节点
负责管理节点的资源及使用情况
YARN核心组件(包含ResourceManager和NodeManager)
ApplicationMaster
Container
YARN架构核心组件-ResouceManager
ResourceManager组成
ResourceScheduler->资源调度器,根据节点的容量、队列情况