YARN环境部署

最新推荐文章于 2025-01-07 18:30:06 发布

原创最新推荐文章于 2025-01-07 18:30:06 发布 · 554 阅读

0 ·

CC 4.0 BY-SA版权

Hadoop 专栏收录该内容

43 篇文章

订阅专栏

本文介绍如何配置YARN以支持MapReduce作业，并详细解释了必要的XML配置修改。通过设置yarn.log-aggregation-enable参数，确保日志聚合正常工作，避免日志文件不存在的问题。文章还指导如何启动ResourceManager和NodeManager进程，以及如何通过浏览器访问ResourceManager状态。最后，提供了运行示例作业的具体步骤。

etc/hadoop/mapred-site.xml

添加下面的配置：

<configuration>
    <property>
        <name>mapreduce.framework.name</name>
        <value>yarn</value>
    </property>
</configuration>

etc/hadoop/yarn-site.xml

添加下面的配置:

<configuration>
    <property>
        <name>yarn.nodemanager.aux-services</name>
        <value>mapreduce_shuffle</value>
    </property>
    
     <property>
        <name>yarn.nodemanager.local-dirs</name>
        <value>/home/iie4bu/app/tmp/hadoop-tmp/nm-local-dir</value>
    </property>
    
<!-- 用yarn logs -applicationId application_1692763927489_0001时需要进行配置, 否则 -->
     <property>
            <name>yarn.log-aggregation-enable</name>
            <value>true</value>
     </property>

</configuration>

如果不设置yarn.log-aggregation-enable会出现/tmp/logs/iie/logs/application_xxxxxxx does not exist

启动ResourceManager进程和NodeManager进程

sbin/start-yarn.sh

访问Resource Manager

浏览器中输入地址http://ip:8088
在这里插入图片描述
表示存活的Node个数是1个。

运行一个作业

在hadoop-2.6.0-cdh5.15.1/share/hadoop/mapreduce路径下有一个hadoop-mapreduce-examples-2.6.0-cdh5.15.1.jar示例文件，里面有很多测试方法。
运行命令：

hadoop jar hadoop-mapreduce-examples-2.6.0-cdh5.15.1.jar wordcount /input/wc/hello.txt /output/wc/