SPARK启动历史任务查看

SPARK历史任务查看需要一下配置:

 

  1. 修改spark-defaults.conf配置文件

    1.   spark.eventLog.enabled             true

    2.   spark.eventLog.dir                       hdfs://192.168.9.110:9000/eventLogs

    3.   spark.eventLog.compress          true

  2. 修改spark-env.sh配置文件

    1. export SPARK_HISTORY_OPTS="-Dspark.history.ui.port=18080 -Dspark.history.retainedApplications=3 -Dspark.history.fs.logDirectory=hdfs://DEV-HADOOP-01:9000/sparkHistoryLogs"

  3. 以上两个配置中spark.eventLog.dir和SPARK_HISTORY_OPTS都用到了hdfs来存储历史任务的日志信息.所以需要提前在hdfs中新建这两个目录 hdfs://192.168.9.110:9000/eventLogs和hdfs://DEV-HADOOP-01:9000/sparkHistoryLogs

    1. 进入hadoop的bin目录 命令 :  cd /data/server/hadoop-2.6.0/bin

    2. 新建hdfs://192.168.9.110:9000/eventLogs命令 : ./hadoop dfs -mkdir /eventLogs

    3. 新建hdfs://DEV-HADOOP-01:9000/sparkHistoryLogs命令 : ./hadoop dfs -mkdir /sparkHistoryLogs

  4. 重启spark集群

  5. 启动历史任务进程

    1. sbin/start-history-server.sh

  6. 历史任务进程启动验证

    1. 执行jps命令,出现HistoryServer进程

  7. 查看历史任务Web UI

    1. http://192.168.9.110:18080/

Spark Launcher是一个命令行工具,用于启动Spark应用程序,但它本身并不直接提供访问Spark任务累加器值的功能。累加器(Accumulator)是Spark中一种用于在分布式环境中共享和累积数据的机制,它们可以在作业的各个阶段保持状态。 要获取Spark任务的累加器值,你需要在你的Spark应用程序中定义累加器,然后在适当的阶段(例如Spark函数或Task)中更新它们,并在需要的地方读取这些值。通常这涉及到以下几个步骤: 1. **定义累加器**: 在`SparkConf`中创累加器实例,如`SparkContext.accumulator()`。 ```python from pyspark import SparkContext sc = SparkContext(...) total = sc.accumulator(0) ``` 2. **更新累加器**: 在map或reduce等操作中,使用`update()`方法增加累加器的值。 ```python def process_function(value): total.update(value) # 其他处理逻辑... ``` 3. **读取累加器值**: 在你的任务完成或需要获取值的地方,使用`value()`方法获取累计值。 ```python result = total.value ``` 4. **在Spark应用外部获取**: 如果你想从Spark Launcher外部获取累加器值,可能需要通过Spark Job历史Spark UI查看Spark UI提供了实时的累加器视图,而Job History则记录了每个任务的详细信息,包括累加器的最终值。 请注意,Spark Launcher的主要作用是启动和监控Spark应用程序,实际的程序逻辑和累加器操作应该在你的Spark代码中完成。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值