spark on yarn webUI logs不能查看

最新推荐文章于 2025-06-16 20:47:24 发布

原创最新推荐文章于 2025-06-16 20:47:24 发布 · 4.1k 阅读

7 ·

CC 4.0 BY-SA版权

hadoop 同时被 2 个专栏收录

12 篇文章

订阅专栏

spark

2 篇文章

订阅专栏

本文介绍如何在YARN集群中正确配置日志监控功能，包括启用日志聚合、设置日志服务地址等步骤，确保用户能通过YARN Web界面查看任务日志。

部署运行你感兴趣的模型镜像

执行spark on yarn 执行：./bin/spark-submit --class org.apache.spark.examples.SparkPi --master yarn-cluster --executor-memory 1G --num-executors 3 ./lib/spark-examples-1.6.3-hadoop2.6.0.jar 10 命令执行成功后在yarn 资源管理界面查看不了logs

参考博客：https://blog.youkuaiyun.com/lisongjia123/article/details/78639058

问题描述

在yarn上跑一个hadoop任务时，通过yarn的web管理后台(serveraddress:8088)想查看该任务的的任务时，发现提示如下错误：

Java.lang.Exception:Unknown container.Container either has not started or has already completed or doesn;t belong to this node at all.

参考博客给出的解放方法

下来查询官方文档后，才了解到yarn的日志监控功能默认是处于关闭状态的，需要我们进行开启，开启步骤如下：

Ps:下面配置的文件的位置在hadoop根目录 etc/haddop文件夹下，比较老版本的Hadoop是在hadoop根目录下的conf文件夹中

一、在yarn-site.xml文件中添加日志监控支持

该配置中添加下面的配置：

<property>
    <name>yarn.log-aggregation-enable</name>
    <value>true</value>
</property>

二、在mapred-site.xml文件中添加日志服务的配置

该配置文件中添加如下配置：

<property>
    <!-- 表示提交到hadoop中的任务采用yarn来运行，要是已经有该配置则无需重复配置 -->
    <name>mapreduce.framework.name</name>
    <value>yarn</value>
</property>
<property>
  <!--日志监控服务的地址，一般填写为nodenode机器地址 -->
    <name>mapreduce.jobhistroy.address</name>
    <value>master:10020</value>
</property>
<property>
    <name>mapreduce.jobhistroy.webapp.address</name>
    <value>master:19888</value>
</property>