1,在HDFS 上创建放历史文件的目录
2,配置spark-env.sh的SPARK_HISTORY_OPTS=“-Dspark.eventLog.dir=第一步创建的目录”
3,配置spark-defaults.conf 的spark.eventLog.enabled=true,spark.eventLog.dir=第一步创建的目录,spark.eventLog.compress=true
4,启动spark-history-server sbin/start-history-server.sh 第一步创建的目录.
saprk应用未执行sc.stop 程序不会结束,历史信息也不会写入。
本文介绍如何配置Spark历史服务器以记录并展示Spark应用的历史信息。主要包括创建存放历史文件的HDFS目录、配置spark-env.sh和spark-defaults.conf文件、启动spark-history-server等步骤。
989

被折叠的 条评论
为什么被折叠?



