yarn-site.xml的配置

本文详细介绍了Hadoop YARN的配置方法,特别是yarn-site.xml文件中的关键参数及其默认值。这些参数涉及资源管理器(ResourceManager)、节点管理器(NodeManager)以及资源调度等方面。
部署运行你感兴趣的模型镜像

代码块

本人使用的是hadoop-2.7.3
若是简单启动hadoop,无特别要求以下配置即可

<configuration>
    <property>
        <name>yarn.resourcemanager.hostname</name>
        <value>master</value>
    </property>
    <property>
        <name>yarn.nodemanager.aux-services</name>
        <value>mapreduce_shuffle</value>
    </property>
</configuration>

完整yarn-site.xml的配置要理解各参数的准确含义后,针对自己的要求更改配置

参数默认值描述
yarn.resourcemanager.hostnameRM的hostname
yarn.resourcemanager.address${yarn.resourcemanager.hostname}:8032RM对客户端暴露的地址,客户端通过该地址向RM提交应用程序等
yarn.resourcemanager.scheduler.address${yarn.resourcemanager.hostname}:8030RM对AM暴露的地址,AM通过地址想RM申请资源,释放资源等
yarn.resourcemanager.webapp.address${yarn.resourcemanager.hostname}:8088RM对外暴露的web http地址,用户可通过该地址在浏览器中查看集群信息
yarn.resourcemanager.webapp.https.address${yarn.resourcemanager.hostname}:8090web https 地址
yarn.resourcemanager.resource-tracker.address${yarn.resourcemanager.hostname}:8031RM对NM暴露地址,NM通过该地址向RM汇报心跳,领取任务等
yarn.resourcemanager.resource-tracker.client.thread-count50处理来自NM的RPC请求的handler数
yarn.resourcemanager.admin.address${yarn.resourcemanager.hostname}:8033管理员可以通过该地址向RM发送管理命令等
yarn.resourcemanager.scheduler.class
org.apache.hadoop.yarn.server.resourcemanager.scheduler.capacity.CapacityScheduler资源调度器主类
yarn.resourcemanager.scheduler.client.thread-count50处理来自AM的RPC请求的handler数
yarn.scheduler.minimum-allocation-mb1024可申请的最少内存资源,以MB为单位
yarn.scheduler.maximum-allocation-mb8192可申请的最大内存资源,以MB为单位
yarn.scheduler.minimum-allocation-vcores1可申请的最小虚拟CPU个数
yarn.scheduler.maximum-allocation-vcores32可申请的最 大虚拟CPU个数
yarn.nodemanager.local-dirs${hadoop.tmp.dir}/nm-local-dir中间结果存放位置,可配置多目录
yarn.log-aggregation-enablefalse是否启用日志聚合
yarn.nodemanager.remote-app-log-dir/tmp/logs日志聚合目录
yarn.nodemanager.resource.memory-mb8192NM总的可用物理内存,以MB为单位。一旦设置,不可动态修改
yarn.nodemanager.resource.cpu-vcores8可分配的CPU个数
yarn.nodemanager.vmem-check-enabledtrue虚拟内存检查
yarn.nodemanager.vmem-check-enabledtrue物理内存检查
mapreduce.map.memory.mb这个参数指定用于Map任务(Map task)的内存大小,其值应该在ResourceManager中的最大最小container之间。如果没有配置则通过如下简单公式获得:max(MIN_CONTAINER_SIZE, (Total Available RAM) / containers))
mapreduce.reduce.memory.mb这个参数指定用于Reduce任务(Reduce task)的内存大小,其值应该在ResourceManager中的最大最小container之间。如果没有配置则通过如下简单公式获得:max(MIN_CONTAINER_SIZE, (Total Available RAM) / containers))
yarn.nodemanager.vmem-pmem-ratio2.1物理内存与虚拟内存的比率
yarn.nodemanager.aux-servicesNodeManager上运行的附属服务。需配置成mapreduce_shuffle,才可运行MapReduce程序

由于更改集群配置比较麻烦,且容易出错
建议一些经常变动的配置不要在yarn-site.xml中配置 ,例如:

   yarn.nodemanager.vmem-check-enabled
   yarn.nodemanager.vmem-pmem-ratio
   mapreduce.map.memory.mb
   mapreduce.reduce.memory.mb
   yarn.log-aggregation-enable
   ......

类似这些控制、监控container内存使用和mapreduce任务运行的资源分配,以及日志合并的变量可以在使用是随时更改,例如在hive中:

    hive > set mapreduce.map.memory.mb;
    mapreduce.map.memory.mb=4096
    hive > set  mapreduce.reduce.memory.mb;
    mapreduce.reduce.memory.mb=4096
    hive > set yarn.nodemanager.vmem-pmem-ratio;
    yarn.nodemanager.vmem-pmem-ratio=4.2

本文参考地址:http://www.itnose.net/detail/6673635.html

您可能感兴趣的与本文相关的镜像

Stable-Diffusion-3.5

Stable-Diffusion-3.5

图片生成
Stable-Diffusion

Stable Diffusion 3.5 (SD 3.5) 是由 Stability AI 推出的新一代文本到图像生成模型,相比 3.0 版本,它提升了图像质量、运行速度和硬件效率

<think>好的,用户需要查找yarn-site.xml配置内容或示例,我需要根据之前的引用和Hadoop知识来回答。首先,用户之前的问题是关于Hadoop的几个配置文件,现在他们想了解yarn-site.xml的具体配置。首先,我应该回忆一下yarn-site.xml的作用。YARNHadoop的资源管理框架,负责集群资源的管理和作业调度。yarn-site.xml包含YARN相关的配置参数,比如ResourceManager、NodeManager的设置,资源分配,日志聚合等。接下来,我需要检查之前的引用。引用[1]提到了core-site.xml和hdfs-site.xml,但并没有详细说明yarn-site.xml。引用[2]是关于core-site.xml的参数,可能没有直接帮助。不过用户现在明确询问yarn-site.xml,所以需要依靠自己的知识来构造回答。 我需要确保回答的结构清晰,符合用户要求的系统级指令,比如使用正确的LaTeX格式,生成相关问题,引用标识等。同时,用户希望回答真实可靠,所以需要提供准确的配置示例和参数说明。可能的配置项包括:- yarn.resourcemanager.hostname:ResourceManager的主机名-yarn.nodemanager.aux-services:NodeManager的辅助服务,如MapReduce的shuffle-yarn.nodemanager.resource.memory-mb:NodeManager可用的物理内存-yarn.scheduler.minimum-allocation-mb:容器的最小内存分配-yarn.log-aggregation-enable:是否启用日志聚合另外,用户可能需要示例配置代码,所以需要提供一个典型的yarn-site.xml配置示例,用XML格式展示,并注释每个参数的作用。生成的相关问题需要围绕YARN配置的优化、参数调整、高可用性设置等,这样可以引导用户进一步探索。最后,确保回答中引用之前的引用[1]和[2]适当的位置,比如在提到配置文件作用时引用[1],在参数说明时参考类似结构引用[2]的表格,但用户没有提供yarn-site.xml的具体引用,所以可能需要调整引用标记的位置,或者仅在适用的情况下引用已有的内容。</think>### yarn-site.xml 配置内容解析 `yarn-site.xml` 是 Hadoop YARN(资源管理框架)的核心配置文件,用于定义资源调度、节点管理、日志聚合等关键参数[^1]。以下为常见配置项及示例: #### 1. **基础资源配置** - **ResourceManager 地址** ```xml <property> <name>yarn.resourcemanager.hostname</name> <value>master</value> </property> ``` 指定 ResourceManager 运行的主机名。 - **NodeManager 辅助服务** ```xml <property> <name>yarn.nodemanager.aux-services</name> <value>mapreduce_shuffle</value> </property> ``` 启用 MapReduce 任务的 Shuffle 功能。 #### 2. **资源分配参数** - **单个容器最小内存** $$ \text{yarn.scheduler.minimum-allocation-mb} = 1024 \, \text{MB} $$ ```xml <property> <name>yarn.scheduler.minimum-allocation-mb</name> <value>1024</value> </property> ``` 定义容器(Container)可申请的最小内存。 - **NodeManager 总可用内存** $$ \text{yarn.nodemanager.resource.memory-mb} = 8192 \, \text{MB} $$ ```xml <property> <name>yarn.nodemanager.resource.memory-mb</name> <value>8192</value> </property> ``` 限制单个节点分配给 YARN 的总物理内存。 #### 3. **高可用性与日志管理** - **ResourceManager 高可用** ```xml <property> <name>yarn.resourcemanager.ha.enabled</name> <value>true</value> </property> <property> <name>yarn.resourcemanager.ha.rm-ids</name> <value>rm1,rm2</value> </property> ``` 启用 ResourceManager 的双机高可用模式。 - **日志聚合功能** ```xml <property> <name>yarn.log-aggregation-enable</name> <value>true</value> </property> ``` 将容器日志集中存储到 HDFS,避免本地丢失。 #### 完整配置示例: ```xml <configuration> <!-- ResourceManager 配置 --> <property> <name>yarn.resourcemanager.hostname</name> <value>master</value> </property> <!-- NodeManager 辅助服务 --> <property> <name>yarn.nodemanager.aux-services</name> <value>mapreduce_shuffle</value> </property> <!-- 资源分配 --> <property> <name>yarn.scheduler.minimum-allocation-mb</name> <value>1024</value> </property> <property> <name>yarn.nodemanager.resource.memory-mb</name> <value>8192</value> </property> <!-- 日志聚合 --> <property> <name>yarn.log-aggregation-enable</name> <value>true</value> </property> </configuration> ```
评论 1
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值