本文包括如下内容:
-
Spark History Server的作用
-
配置Spark History Server
-
运行Spark History Server
-
查看Spark程序的运行信息
Spark History Server的作用
在 运行Spark应用程序的时候,driver会提供一个webUI用于展现应用程序的运行信息,但是该webUI随着应用程序的完成而关闭端口。也就是说,这个服务是伴随Spark应用程序的运行周期的,也就是当应用程序运行完成后,将无法查看应用程序的历史记录。Spark history server就是为了应对这种情况而产生的,通过配置,Spark应用程序在运行完应用程序之后,将应用程序的运行信息写入指定目录,而Spark history server可以将这些运行信息装载并以web的方式供用户浏览
伴随Spark应用程序而启动的web查看服务的默认端口号是4040,或者4041(如果当前端口被占用,比如4040被占用,那么Spark会抛一个异常,但是不影响应用继续运行,dr
Spark History Server详解与配置

本文介绍了Spark History Server的作用,如何配置和启动它,以及如何查看作业执行情况和详细信息,包括Job数量、Stage数量、Stage详情和Executor执行情况。
最低0.47元/天 解锁文章
3951

被折叠的 条评论
为什么被折叠?



