spark作业运行集群有俩种部署模式,一种是spark Standalone集群,还有一种是YARN集群+Spark客户端
所以我们认为提交spark作业的俩种主要方式就是,就是Spark StandAlone和YARN,这俩种方式,分别还分为俩种模式,分别是client mode和cluster mode
local模式的基本原理
local模式,没有所谓的master+worker这种概念
local模式,相当于,启动一个本地进程,然后在一个进程内,模拟spark集群中作业的运行
一个spark作业,就对应了进程中的一个或多个executor线程
就开始执行,包括作业的调度,task分配
在实际工作中,local模式主要用于测试,在开发环境中,直接运行spark程序,便于看到打印日志