本地启spark history server,spark.history.fs.logDirectory除了可以设置为hdfs远程目录外,还可以设置为本地路径,如:
./start-history-server.sh file:///home/merrily01/scripts/logs/tmp_log/
这样直接把lz4文件放到上述本地路径下即可解析加载,无需获取lz4后再上传至指定hdfs路径,更方便快捷。
测试,上述方式在3.0的spark使用的时候可能会遇到问题?
所以还有如下方式:
通过参数配置方式,修改日志文件存储路径:
在spark包的conf目录下,同样使用spark-defaults.conf配置文件,通过:
spark.history.fs.logDirectory /home/prodadmin/merrily01/tmp/history_log
然后,直接通过./start-history-server.sh 启动服务即可。
Spark History Server:本地路径设置
本文介绍了如何在本地启动Spark History Server,并将其日志目录设置为本地路径,以简化lz4日志文件的处理。当使用file:///home/merrily01/scripts/logs/tmp_log/作为logDirectory时,可以直接在该路径下放置lz4文件进行解析和加载,但可能在Spark 3.0中遇到问题。作为替代方案,可以通过修改spark-defaults.conf配置文件,将logDirectory设置为/home/prodadmin/merrily01/tmp/history_log,然后启动服务。
3944

被折叠的 条评论
为什么被折叠?



