121、Spark核心编程进阶之Spark Standalone集群架构

本文详细介绍了SparkStandalone集群架构,包括集群管理器Master进程和工作节点Worker进程的角色与功能。探讨了SparkStandalone模式与YARN集群模式的区别,以及在无需YARN和HDFS的情况下,如何利用Master+Worker架构进行Spark作业的编写与运行。此外,还阐述了两种部署模式client和cluster的工作原理。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

13274599-0bcf88b9abf6a412.png

Standalone集群架构.png

 

Spark Standalone集群
集群管理器,cluster manager:Master进程
工作节点:Worker进程

Spark Standalone集群模式与YARN集群模式不同之处就在于:
如果是Spark Standalone模式,甚至你根本不需要YARN集群,甚至连HDFS集群都可以不需要
Spark,Master+Worker集群架构,就足够了,然后就可以编写spark作业,提交作业到Master+Worker集群架构中去运行

两种deploy mode:

  1. client:你在哪台机器上,用spark-submit提交spark作业,就会在那台机器上启动driver进程
  2. cluster:作业是提交给master,master找一台worker进程,启动driver
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值