1、概念
Hadoop三大件:HDFS、MapReduce、Yarn
Yarn其实就是一个类似于操作系统一样的东西。
Yarn是MapReduce运行的环境,Yarn可以管理程序运行所需要的东西(内存,CPU,带宽等资源)
Yarn诞生于Hadoop,但是现在已经脱离了Hadoop,变成了一个独立的软件,系统。
2、Yarn的组成部分
我们的Yarn,其实有两大部分组成:
1、ResourceManager (BOSS): 1个
他用来管理整个的Yarn平台,里面有一个资源调度器。
2、NodeManager (各个机器上的主管) 多个
听从我们的ResouceManager的调遣。是每一台电脑的管家。
3、Container(容器)
每一个NodeManager中,有一个或者多个这样的容器。是包含了一些资源的封装(CPU,内存,硬盘等),类似于我们熟悉的虚拟机。
4、AppMaster (项目经理)
每一个MapReduce任务启动提交后,会有一个对应的AppMaster。这个主要作用是负责整个job任务的运行。