配置spark的HistoryServer

本文详细介绍了如何在Spark环境中配置historyserver,包括修改`spark-env.sh`和`spark-defaults.conf`文件,指定HDFS日志路径,并启动服务。同时提及了在本地运行速度优于YARN的情况分析。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

如果需要在spark中配置好historyserver,则需要再修改两处设置。

1.编辑spark-env.sh文件,添加如下所示:

export SPARK_HISTORY_OPTS="-Dspark.history.ui.port=18080 -Dspark.history.retainedApplications=20 -Dspark.history.fs.logDirectory=hdfs://192.168.48.132:9000/log"

2.编辑spark-defalut.conf文件,添加如下语句:

spark.eventLog.enabled           true
spark.eventLog.dir               hdfs://192.168.48.132:9000/log
spark.history.ui.port            18080
spark.history.fs.logDirectory    hdfs://192.168.48.132:9000/log
spark.history.retainedApplications    20
spark.yarn.historyServer.address 192.168.48.132:18080

注:首先要手工建立日志记录文件夹,服务器不会自动建立,建立命令如下。
hdfs dfs -mkdir hdfs://192.168.48.132:9000/log

然后再在spark目录下启动命令:

./sbin/start-history-server.sh

如果通过jps能够看到HistoryServer,则说明已经启动了。

你可以通过http://ip地址:18080查看spark程序的运行。

由于本人把master和worker都放在同一台虚拟机上,内核是2,所以local下运行的速度反而比yarn要快很多,速度差3倍多

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值