Hadoop ResourceManager

最新推荐文章于 2025-03-17 17:18:33 发布

368chen

最新推荐文章于 2025-03-17 17:18:33 发布

阅读量1.4k

点赞数 1

分类专栏：大数据文章标签： hadoop 大数据

本文链接：https://blog.youkuaiyun.com/qq_16236875/article/details/106232516

版权

大数据专栏收录该内容

17 篇文章

订阅专栏

本文深入探讨YARN-ResourceManager的工作原理，包括资源管理和任务调度机制，解析Container的生命周期管理及YARN内部结构，如ApplicationMasterService和Scheduler等功能模块。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

YARN-ResourceManager

负责全局的资源管理金额任务调度，把整个集群当成计算资源池，只关注分配，不管应用，且不负责容错。

资源管理

1）以前资源是每个节点分成一个个的Map slot和Reduce slot ,现在施一个个Container，每个Container 可以根据需要运行ApplicationMaster, Map, Reduce 或者任意的程序。

2）以前的资源分配是静态的，目前是动态的，资源利用率更高。

3）Container 是资源申请的单位，一个资源申请格式：<resource-name,priority,resouce-requirement,number-of-container>,resource-name: 主机名，机架名或*（代表任意机器），resource-requirement：目前只支持CPU和内存

4）用户提交作业到ResourceManger，然后在某个NodeManager上分配一个Container 来运行ApplicationMaster，ApplicationMaster 在根据自身程序需要向ResourceManager 申请资源。

5）YARN 有一套Container 的生命周期管理机制，而ApplicationMaster 和其COntainer 之间的管理是应用程序自己定义的。

任务调度

1）只关注资源的使用情况根据需求合理分配资源

2）Scheduer 可以根据申请的需要，在特定的机器上申请特定的资源（ApplicationMaster 负责申请资源时的数据本地化的考虑，ResourceManager 将尽量满足其申请需求，在指定的机器上分配Container，从而减少数据移动）

内部结构

1） Client Service ：应用提交，终止，输出信息(应用，队列，集群等的状态信息）

2）Adaminstration Service ：队列，节点，Client 权限管理

3）ApplicationMasterService: 注册，终止ApplicationMaster ，获取ApplicationMaster 的资源申请或取消的请求，并将其异步地传给Scheduler，单线程处理。

4）ApplicationMaster Liveliness Monitor: 接收ApplicationMaster 的心跳信息，如果某个ApplicationMaster 在一定时间内没有发送心跳，则被任务失败，其资源将会被回收，然后ResourceManager会重新分配一个ApplicationMaster 运行该应用。

5）Resource Tracker Service : 注册节点，接收各注册节点的心跳消息

6）NodeManager LiveLiness Monitor ：监控每个节点的心跳消息，如果长时间没有收到心跳消息，则认为该节点无效，同时所有在该节点上的Container 都标记为无效，也不会调度任务到该节点运行。

7）ApplicationManager：管理应用程序，记录和管理已完成的应用

8）ApplicationMaster Launcher: 一个应用提交后，负责与NodeManager交互，分配container 并加载ApplicationMaster，也负责终止或销毁。

9）YamScheduler ：资源调度分配，有FIFO，Fair，Capacity 方式

10）ContainerAliiocationExpirer: 管理已分配但没有启用的Container，超过一定时间则将其回收。