Hadoop历史服务器
Hadoop自带了一个历史服务器,可以通过历史服务器查看已经运行完的Mapreduce作业记录,比如用了多少个Map、用了多少个Reduce、作业提交时间、作业启动时间、作业完成时间等信息。默认情况下,Hadoop历史服务器是没有启动的,我们可以通过下面的命令来启动Hadoop历史服务器
历史服务器开启 mr-jobhistory-daemon.sh start historyserver
配置历史服务器
在配置文件前需要注意的一点就是先把进程打开 start-all.sh,不然是访问不到网页的
-
首先根目录创建一个目录文件夹

-
运行 一 个wordcount 程序 图中标注有详细步骤

-
在web端网页观察 yarn 的页面 ip地址为 主机名:8088
注:如果进入网页没有application说明配置文件有问题,仔细查看 集群配置文件内容 进入有详细配置文件代码

本文介绍了如何启动和配置Hadoop的历史服务器,以便查看MapReduce作业的历史记录。通过历史服务器,可以获取作业的Map和Reduce任务数量、作业时间等信息。首先确保启动所有Hadoop进程,然后创建目录并运行Wordcount示例程序。在Web界面中通过主机名:8088访问YARN页面。配置涉及mapred-site.xml和yarn-site.xml文件,所有集群机器都需要进行配置,并确保日志聚合设置正确。如果遇到问题,可能需要重新启动相关进程或检查配置。
最低0.47元/天 解锁文章
2564

被折叠的 条评论
为什么被折叠?



