SparkContext初始化过程

本文详细介绍了SparkContext的启动过程,包括读取SparkConf配置、创建SparkEnv、初始化TaskScheduler及DAGScheduler,并启动WebUI等关键步骤。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

SparkContext是Spark进行应用开发的主要接口,是Spark上层应用与底层实现的中转站。SparkContext最重要的入参是SparkConf。

步骤一: 读取SparkConf参数配置,进行一些基本的参数值的判断赋值。
在这里插入图片描述
步骤二: 根据SparkConf创建SparkEnv,包含Spark实例运行时候所需要的所有运行时所有环境变量。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
步骤三: 创建TaskScheduler,同时根据Spark运行模式选择 相应的schedulerBackend
在这里插入图片描述
createTaskScheduler最关键一步就是根据master属性判断spark运行模式,从而生成对应的schedulerBackend子类。创建的schedulerBackend子类放到TaskScheduler中,后续任务分发有重要作用。TaskScheduler是schedulerBackend的入参。
在这里插入图片描述
TaskScheduler启动,schedulerBackend也要启动。
在这里插入图片描述
步骤四: 以上一步创建的 TaskScheduler实例为参数,创建DAGScheduler对象。
在这里插入图片描述
步骤五: 启动Web UI

总结如下:
在这里插入图片描述

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值