【Spark】History Server配置

本文介绍了如何配置Spark History Server以查看已完成应用程序的历史记录。主要内容包括修改`spark-env.sh`和`spark-defaults.conf`配置文件,设置web端口、历史记录数量和日志路径,启动Spark和History Server,并通过web UI查看历史应用程序。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

在spark上跑应用程序时,可以在4040端口查看运行情况,但是一旦程序结束,这个端口便关闭了,这时想要查看历史数据,就要启用history server。具体步骤如下:

首先修改spark/conf下的两个配置文件

第一个:spark-env.sh

vim spark-env.sh

添加如下内容
在这里插入图片描述
含义:

  • history server的web端口为18080
  • 保留10个应用程序的历史记录
  • 历史记录日志的地址
    • 也可以选择其他地址,比如放到hdfs上

保存后source一下

source spark-env.sh

第二个:spark-defaults.conf

没有这个文件的话用spark-defaults.conf.template文件复制一个就好

添加如下内容
在这里插入图片描述
含义:

  • 启动事件日志
  • 事件日志地址

其他参数可以去官网上看

然后来到spark/sbin文件夹下,启动spark和history server

start-all.sh
start-history-servr.sh

jps一下,看到两个管理器,三个节点,以及历史服务器就说明启动成功了
在这里插入图片描述
(运行对应的stop-xx.sh就可以关闭spark和history server)

在localhost:18080即可打开历史服务器的web UI

来到spark文件夹下,运行一下spark自带的样例

bin/run-example SparkPi

如图所示运行成功!

在这里插入图片描述
然后就可以在web UI中看到该应用程序的历史记录啦~

在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值