
yarn
rolin-刘瑞
技术GEEK
展开
-
yarn-site.xml相关配置参数列表说明
ResourceManager相关配置参数(1) yarn.resourcemanager.address参数解释:ResourceManager 对客户端暴露的地址。客户端通过该地址向RM提交应用程序,杀死应用程序等。默认值:${yarn.resourcemanager.hostname}:8032(2) yarn.resourcemanager.schedule转载 2017-10-11 15:49:26 · 11407 阅读 · 0 评论 -
Yarn 内存分配管理机制及相关参数配置
理解Yarn的内存管理与分配机制,对于我们搭建、部署集群,开发维护应用都是尤为重要的,对于这方面我做了一些调研供大家参考。一、相关配置情况关于Yarn内存分配与管理,主要涉及到了ResourceManage、ApplicationMatser、NodeManager这几个概念,相关的优化也要紧紧围绕着这几方面来开展。这里还有一个Container的概念,现在可以先把它理解为运行ma转载 2017-10-11 18:50:09 · 6149 阅读 · 0 评论 -
Hadoop 新特性、改进、优化和Bug分析系列5:YARN-3
Hadoop jira链接:https://issues.apache.org/jira/browse/YARN-3所属范围(新特性、改进、优化或Bug):新特性修复版本:2.0.3-alpha及以上版本所属分支(Common、HDFS、YARN或MapReduce):YARN涉及模块:nodemanager英文标题:“Add support for CPU isolation转载 2017-10-11 18:29:15 · 6352 阅读 · 0 评论 -
yarn中的cgroup调度
cgroup控制cpu,/proc/mounts下有一个/sys/fs/cgroup/cpu配置路径,此部分是cgroup用来控制cpu隔离的路径配置。在/sys/fs/cgroup/cpu下添加子路径hadoop-yarn,这个路径是yarn用来控制cpu的隔离的根路径 通过yarn.nodemanager.linux-container-executor.cgroups.hiera转载 2017-10-11 18:13:14 · 6934 阅读 · 1 评论 -
Hadoop YARN配置参数剖析(2)—权限与日志聚集相关参数
注意,配置这些参数前,应充分理解这几个参数的含义,以防止误配给集群带来的隐患。另外,这些参数均需要在yarn-site.xml中配置。1. 权限相关配置参数这里的权限由三部分组成,分别是:(1)管理员和普通用户如何区分 (2)服务级别的权限,比如哪些用户可以向集群提交ResourceManager提交应用程序,(3)队列级别的权限,比如哪些用户可以向队列A提交作业等。转载 2017-10-11 18:07:16 · 6252 阅读 · 0 评论 -
Hadoop YARN配置参数剖析(5)—Capacity Scheduler相关参数
Capacity Scheduler是YARN中默认的资源调度器。想要了解Capacity Scheduler是什么,可阅读我的这篇文章“Hadoop Capacity Scheduler分析”。在Capacity Scheduler的配置文件中,队列queueX的参数Y的配置名称为yarn.scheduler.capacity.queueX.Y,为了简单起见,我们记为Y,则每个队转载 2017-10-11 18:06:18 · 6383 阅读 · 0 评论 -
Hadoop YARN配置参数剖析(1)—RM与NM相关参数
注意,配置这些参数前,应充分理解这几个参数的含义,以防止误配给集群带来的隐患。另外,这些参数均需要在yarn-site.xml中配置。1. ResourceManager相关配置参数(1) yarn.resourcemanager.address参数解释:ResourceManager 对客户端暴露的地址。客户端通过该地址向RM提交应用程序,杀死应用程序等。默转载 2017-10-11 18:04:49 · 6120 阅读 · 0 评论 -
Hadoop YARN配置参数剖析(3)—MapReduce相关参数
MapReduce相关配置参数分为两部分,分别是JobHistory Server和应用程序参数,Job History可运行在一个独立节点上,而应用程序参数则可存放在mapred-site.xml中作为默认参数,也可以在提交应用程序时单独指定,注意,如果用户指定了参数,将覆盖掉默认参数。以下这些参数全部在mapred-site.xml中设置。1. MapReduce Job转载 2017-10-11 17:34:39 · 6401 阅读 · 0 评论 -
Hadoop YARN配置参数剖析(4)—Fair Scheduler相关参数
首先在yarn-site.xml中,将配置参数yarn.resourcemanager.scheduler.class设置为org.apache.hadoop.yarn.server.resourcemanager.scheduler.fair.FairScheduler。Fair Scheduler的配置选项包括两部分,其中一部分在yarn-site.xml中,主要用于配置调度器级别的参转载 2017-10-11 17:31:15 · 6261 阅读 · 0 评论 -
Hadoop YARN中内存和CPU两种资源的调度和隔离
Hadoop YARN同时支持内存和CPU两种资源的调度(默认只支持内存,如果想进一步调度CPU,需要自己进行一些配置),本文将介绍YARN是如何对这些资源进行调度和隔离的。在YARN中,资源管理由ResourceManager和NodeManager共同完成,其中,ResourceManager中的调度器负责资源的分配,而NodeManager则负责资源的供给和隔离。ResourceM转载 2017-10-11 16:56:13 · 6206 阅读 · 0 评论 -
YARN/MRv2 Resource Manager深入剖析—资源调度器
在YARN中,资源调度器(ResourceScheduler)是一个非常核心的部件,它负责将各个节点上的资源封装成container,并按照一定的约束条件(按队列分配,每个队列有一定的资源分配上限等)分配给各个application。(注意:本文分析基于hadoop-2.0.3-alpha)YARN的资源管理器实际上是一个事件处理器,它需要处理来自外部的6种SchedulerEve转载 2017-10-11 16:03:02 · 6583 阅读 · 0 评论 -
YARN Federation
介绍众所周知,YARN可扩展到数千个节点。 YARN的可伸缩性由Resource Manager确定,并且与节点数,活跃的应用程序,活跃的容器和心跳频率成比例。降低心跳可以提高可扩展性,但对利用率有害。本文档描述了一种基于联邦(federation)的方法,通过联合多个YARN子集,将单个YARN集群扩展到数万个节点。所提出的方法是将大的(10-100k节点)集群划分为称为子集群的较小单元,每...转载 2019-07-22 21:32:01 · 7534 阅读 · 0 评论