Yarn 资源调度器

本文介绍了Yarn的三种调度方式:FIFO、FAIR和DRF,详细解析了它们的工作原理和调度策略。FIFO按照提交顺序调度,FAIR基于内存使用率,而DRF则采用主资源公平调度。Yarn的Capacity Scheduler和FAIR Scheduler通过多队列方式提供更灵活的资源分配,以提高资源利用率和满足不同作业需求。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Yarn的资源调度目前支持内存和CPU两种资源。

Yarn支持三种调度方式:FIFO、FAIR和DRF分别是指先来先服务、公平调度和主资源公平调度

FIFO:先按照优先级高低调度,如果优先级相同,则按照提交时间先后顺序调度,如果提交时间相同,则按照(队列或者应用程序)名称大小(字符串比较)调度;不支持有子队列的情况。

FAIR:按照内存资源使用量比率调度,即按照used_memory/minShare大小调度(核心思想是按照该调度算法决定调度顺序,但还需考虑一些边界情况);

DRF:借鉴了Mesos中的设计策略,按照主资源公平调度算法进行调度(包括内存和CPU)。


Yarn的资源调度器支持三种FIFO Scheduler ,FAIR Scheduler ,Capacity Scheduler。

单队列组织方式:FIFO Scheduler 

  • 将所有的应用程序放到一个队列中。
  • 局限性明显:资源利用率低,无法交叉运行作业。不够灵活,比如紧急的作业无法插队。

多队列组织方式:Capacity Scheduler 和 FAIR Scheduler

  • 每个队列可单独实现调度策略
  • 每个队列对应一定比例的资源
  • 优势明显:按队列组织资源和用户,符合生产需要。不同队列的资源分配策略不同,更加灵活。 

Capacity Scheduler 和 FAIR Scheduler 不同点对比



Hadoop YARN是Hadoop的下一代集群资源管理系统,它将集群资源划分为容器,通过资源调度器来分配管理这些容器。资源调度器的配置对于集群的性能资源利用率至关重要。 首先,需要配置YARN的调度器类型。目前YARN支持两种调度器:容量调度器公平调度器。容量调度器将集群资源按比例分配给不同的队列,每个队列有固定的资源容量;而公平调度器将资源动态分配给各个应用程序,根据应用程序的运行状况动态调整资源分配。 其次,需要配置队列的属性。队列属性包括队列名称、资源容量、资源限制等。资源容量指定了每个队列可以使用的最大资源数量,资源限制是为了避免某个队列占用过多资源而导致其他队列无法正常运行。 另外,还可以配置调度器的策略。调度策略根据不同的需求来决定资源的分配方式,比如公平策略会尽量保持各个应用程序获得相同的资源量,而容量策略则会按照预先设定的比例分配资源。 此外,还需要配置队列的优先级。队列优先级可以保证某个队列在资源不足时获得更多的资源,以确保高优先级的应用程序能够正常运行。 最后,还可以配置一些其他参数,例如最大容器数、最大AM资源比例等。这些参数可以根据具体的需求进行调整,以优化资源管理调度效果。 总之,Hadoop YARN资源调度器的配置需要根据集群的实际情况需求进行灵活的调整,以实现高效的资源管理调度。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值