etc/hadoop/mapred-site.xml
添加下面的配置:
<configuration>
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
</configuration>
etc/hadoop/yarn-site.xml
添加下面的配置:
<configuration>
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
<property>
<name>yarn.nodemanager.local-dirs</name>
<value>/home/iie4bu/app/tmp/hadoop-tmp/nm-local-dir</value>
</property>
<!-- 用yarn logs -applicationId application_1692763927489_0001时需要进行配置, 否则 -->
<property>
<name>yarn.log-aggregation-enable</name>
<value>true</value>
</property>
</configuration>
如果不设置yarn.log-aggregation-enable会出现/tmp/logs/iie/logs/application_xxxxxxx does not exist
启动ResourceManager进程和NodeManager进程
sbin/start-yarn.sh
访问Resource Manager
浏览器中输入地址http://ip:8088

表示存活的Node个数是1个。
运行一个作业
在hadoop-2.6.0-cdh5.15.1/share/hadoop/mapreduce路径下有一个hadoop-mapreduce-examples-2.6.0-cdh5.15.1.jar示例文件,里面有很多测试方法。
运行命令:
hadoop jar hadoop-mapreduce-examples-2.6.0-cdh5.15.1.jar wordcount /input/wc/hello.txt /output/wc/
本文介绍如何配置YARN以支持MapReduce作业,并详细解释了必要的XML配置修改。通过设置yarn.log-aggregation-enable参数,确保日志聚合正常工作,避免日志文件不存在的问题。文章还指导如何启动ResourceManager和NodeManager进程,以及如何通过浏览器访问ResourceManager状态。最后,提供了运行示例作业的具体步骤。
2075

被折叠的 条评论
为什么被折叠?



