Spark-task相关

最新推荐文章于 2025-02-06 13:47:12 发布

原创最新推荐文章于 2025-02-06 13:47:12 发布 · 512 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#task

spark 专栏收录该内容

23 篇文章

订阅专栏

本文深入探讨了Apache Spark框架中任务(Task)的状态管理与结束原因，包括任务执行过程中的状态转换及结束时可能遇到的各种情况。

Spark-task相关

@(spark)[Task]

TaskState

private[spark] object TaskState extends Enumeration {                                                                                                                   

  val LAUNCHING, RUNNING, FINISHED, FAILED, KILLED, LOST = Value                                                                                                        

  val FINISHED_STATES = Set(FINISHED, FAILED, KILLED, LOST)

Task的状态，本文件还包含了mesos相关状态的转换

TaskEndReason

本质上是个枚举类，标识了所有的task end 的reason

/**                                                                                                                                                                     
 * :: DeveloperApi ::                                                                                                                                                   
 * Various possible reasons why a task ended. The low-level TaskScheduler is supposed to retry                                                                          
 * tasks several times for "ephemeral" failures, and only report back failures that require some                                                                        
 * old stages to be resubmitted, such as shuffle map fetch failures.                                                                                                    
 */                                                                                                                                                                     
@DeveloperApi                                                                                                                                                           
sealed trait TaskEndReason

TaskContext

/**                                                                                                                                                                     
 * Contextual information about a task which can be read or mutated during                                                                                              
 * execution. To access the TaskContext for a running task, use:                                                                                                        
 * {{{                                                                                                                                                                  
 *   org.apache.spark.TaskContext.get()                                                                                                                                 
 * }}}                                                                                                                                                                  
 */                                                                                                                                                                     
abstract class TaskContext extends Serializable {

接口定义

TaskContextHelper

/**                                                                                                                                                                     
 * This class exists to restrict the visibility of TaskContext setters.                                                                                                 
 */                                                                                                                                                                     
private [spark] object TaskContextHelper {