Spark中的资源调度

Spark中,每个Application对应一个SparkContext。对于SparkContext之间的调度关系,取决于Spark的运行模式。对Standalone模式而言,Spark Master节点先计算集群内的计算资源能否满足等待队列中的应用对内存和CPU资源的需求,如果可以,则Master创建Spark Driver,启动应用的执行。宏观上来讲,这种对应用的调度类似于FIFO策略。在Mesos和Yarn模式下,底层的资源调度系统的调度策略都是由Mesos和Yarn决定的。具体分类描述如下:

(1)Standalone模式: 默认以用户提交Applicaiton的顺序来调度,即FIFO策略。每个应用执行时独占所有资源。如果有多个用户要共享集群资源,则可以使用参数spark.cores.max来配置应用在集群中可以使用的最大CPU核的数量。如果不配置,则采用默认参数spark.deploy.defaultCore的值来确定。

(2)Mesos模式:如果在Mesos上运行Spark,用户想要静态配置资源的话,可以设置spark.mesos.coarse为true,这样Mesos变为粗粒度调度模式。然后可以设置spark.cores.max指定集群中可以使用的最大核数,与上面Standalone模式类似。同时,在Mesos模式下,用户还可以设置参数spark.executor.memory来配置每个executor的内存使用量。如果想使Mesos在细粒度模式下运行,可以通过mesos://<url-info>设置动态共享cpu core的执行模式。在这种模式下,应用不执行时的空闲CPU资源得以被其他用户使用,提升了CPU使用率。另外,粗粒度调度模式下,cpu和内存将被长期占有直至任务退出,有可能造成资源的浪费,但也使得减少了资源调度的时间。而细粒度下,根据任务的实际需要进行调度资源,但是每次需要资源的时候都动态向系统申请资源,如果任务非常多而且运行的时间也非常短,就会使得资源调度的开销非常的大。

### Apache Spark 资源调度流程详解 #### 1. 集群管理器的角色与功能 在Apache Spark中,资源调度依赖于集群管理器(Cluster Manager),其主要职责在于管理和分配计算节点上的资源给各个应用程序。支持多种类型的集群管理器,包括Standalone、YARN、Mesos以及Kubernetes等[^3]。 #### 2. 应用程序提交过程 当通过`spark-submit`命令提交一个应用时,会指定相应的参数来配置运行环境,比如执行模式(`--deploy-mode`)可以设置为client或cluster两种方式之一[^2]。对于Cluster模式而言,在启动Application Master之前不会有任何Executor被创建;而Client模式下则是在本地直接发起Driver进程并立即请求Executors。 #### 3. Application Master的作用 一旦选择了Cluster部署模式,则会在ResourceManager处注册一个新的ApplicationMaster实例负责协调整个作业生命周期内的所有活动。它向ResourceManager申请容器(Container)用于承载后续产生的Executors,并监控这些组件的状态变化直至完成全部工作负载为止。 #### 4. Executor的获取与释放 随着任务需求的增长,AM持续不断地向RM发出新的Container请求直到满足当前Stage所需数量为止。每个获得批准后的Container都会在其内部启动一个对应的Executor进程专门用来执行具体的Task操作。当某个阶段结束之后不再需要那么多计算能力的时候,多余的Executors会被优雅地终止从而腾出更多可用空间供其他待处理的任务使用。 #### 5. 动态资源调整策略 为了更好地适应不同应用场景下的性能优化目标,Spark还提供了动态分配特性允许根据实际负载情况自动增减参与运算的工作单元数目。这一机制能够有效提高系统的灵活性和效率,减少不必要的等待时间浪费的同时也降低了整体成本开销。 ```bash # 使用spark-submit提交带有动态资源配置的应用示例 $ bin/spark-submit \ --conf "spark.dynamicAllocation.enabled=true" \ --conf "spark.shuffle.service.enabled=true" \ your-application-jar-file.jar ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值