Hadoop集群工作台查看日志报错问题及解决办法

本文介绍如何在Hadoop集群中配置并启用日志监控功能,包括修改yarn-site.xml和mapred-site.xml文件的具体步骤,确保日志聚合正常工作。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

我们在hadoop集群一般需要在工作台查看日志,但是工作台查看日志一般会出现以下情况:

上面的原因是由于yarn的日志监控功能默认是处于关闭状态的,需要我们进行开启,开启步骤如下:

一、在yarn-site.xml文件中添加日志监控支持

该配置中添加下面的配置:

        <!-- 开启日志聚合 -->
        <property>
                <name>yarn.log-aggregation-enable</name>
                <value>true</value>
        </property>
         <!-- 日志时长 -->
        <property>
                <name>yarn.log-aggregation.retain-seconds</name>
                 <value>640800</value>
        </property>
        <property>
                <name>yarn.log.server.url</name>
                <value>http://master:19888/jobhistory/logs/</value>
        </property>
        <!-- 日志聚合目录 -->
        <property>
                <name>yarn.nodemanager.remote-app-log-dir</name>
                <value>/user/container/logs</value>
        </property> 
         <property>
                <name>yarn.nodemanager.resource.memory-mb</name>
                <value>4096</value>
        </property>
         <property>
                <name>yarn.scheduler.minimum-allocation-mb</name>
                <value>2048</value>
        </property>
        <property>
                <name>yarn.scheduler.maximum-allocation-mb</name>
                <value>4096</value>
        </property>
        <property>
                <name>yarn.nodemanager.vmem-pmem-ratio</name>
                <value>5</value>
        </property>

二、在mapred-site.xml文件中添加日志服务的配置

该配置文件中添加如下配置:若是有了的话,无需再次添加

<property>
    <!-- 表示提交到hadoop中的任务采用yarn来运行,要是已经有该配置则无需重复配置 -->
    <name>mapreduce.framework.name</name>
    <value>yarn</value>
</property>
<property>
  <!--日志监控服务的地址,一般填写为nodenode机器地址 -->
    <name>mapreduce.jobhistroy.address</name>
    <value>master:10020</value>
</property>
<property>
    <name>mapreduce.jobhistroy.webapp.address</name>
    <value>master:19888</value>
</property>

三、将修改后的配置文件拷贝到集群中的其他机器(单机版hadoop可以跳过该步骤)

快捷一点可以使用 scp 命令将配置文件拷贝覆盖到其他机器

四、重新启动集群的Hdfs和Yarn服务

./start-all.sh

五、 开启日志监控服务进程

在nodenode机器上执行 sbin/mr-jobhistory-daemon.sh start historyserver 命令,执行完成后使用jps命令查看是否启动成功,若启动成功则会显示出JobHistoryServer服务 

### Hadoop 集群伪分布式安装教程 Hadoop 的伪分布式模式是一种单节点运行方式,它模拟了一个小型的集群环境。在这种模式下,Hadoop 的守护进程可以在同一台机器上运行,并且数据存储在本地文件系统中。以下是关于如何完成 Hadoop 3.3 版本伪分布式安装的具体说明。 #### 准备工作 1. **下载并解压 Hadoop** 下载 Hadoop 3.3.x 并将其解压缩至指定目录 `/opt/hadoop-3.3.2`[^1]。 2. **配置环境变量** 编辑 `~/.bashrc` 文件,在其中添加如下内容以设置 Hadoop 和 Java 环境变量: ```bash export JAVA_HOME=/usr/lib/jvm/java-8-openjdk-amd64 export HADOOP_HOME=/opt/hadoop-3.3.2 export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin ``` 3. **修改核心配置文件** 进入 Hadoop 配置路径 `/opt/hadoop-3.3.2/etc/hadoop/` 后编辑以下三个主要配置文件: - **core-site.xml**: 修改默认文件系统的 URI 地址。 ```xml <configuration> <property> <name>fs.defaultFS</name> <value>hdfs://localhost:9000</value> </property> </configuration> ``` - **hdfs-site.xml**: 设置 NameNode 数据存储位置以及副本数量。 ```xml <configuration> <property> <name>dfs.replication</name> <value>1</value> </property> <property> <name>dfs.name.dir</name> <value>/home/user/hadoop/data/namenode</value> </property> <property> <name>dfs.data.dir</name> <value>/home/user/hadoop/data/datanode</value> </property> </configuration> ``` - **mapred-site.xml**: 将 MapReduce 框架切换为 YARN。 ```xml <configuration> <property> <name>mapreduce.framework.name</name> <value>yarn</value> </property> </configuration> ``` - **yarn-site.xml**: 配置 ResourceManager 和 NodeManager 参数。 ```xml <configuration> <property> <name>yarn.nodemanager.aux-services</name> <value>mapreduce_shuffle</value> </property> <property> <name>yarn.resourcemanager.hostname</name> <value>localhost</value> </property> </configuration> ``` #### 初始化与启动服务 1. **格式化 NameNode** 执行以下命令来初始化 HDFS 文件系统结构: ```bash hdfs namenode -format ``` 此操作会创建一个新的文件系统实例[^1]。 2. **启动 Hadoop 服务** 使用脚本来依次启动各个组件的服务: ```bash start-dfs.sh start-yarn.sh ``` 3. **验证服务状态** 访问 Web UI 页面确认各模块正常运行情况: - Namenode: http://localhost:9870/ - Resourcemanager: http://localhost:8088/ #### SSH 免密登录设置 为了支持后续可能扩展成完全分布式的场景需求,建议提前做好 SSH 免密码认证的工作流程[^2]: ```bash ssh-keygen -t rsa cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys chmod 600 ~/.ssh/authorized_keys ``` 测试连接是否成功无需输入额外信息即可进入远程主机界面。 --- ### 注意事项 确保每一步都严格按照顺序执行完毕后再继续下一步骤;如果遇到任何错误提示,请仔细阅读报错日志定位具体原因所在。
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值