Spark本地模式部署与测试-优快云博客

本文链接：https://blog.youkuaiyun.com/ajax_jquery/article/details/37042079

本文介绍了如何部署和测试Spark的local模式，包括配置spark-env.sh，启动master和worker，以及通过UI和jps检查进程状态。此外，还详细讲解了Spark的不同运行模式，如Local、Standalone、Mesos和YARN，并提供了使用Spark Shell进行测试的例子，如读取本地文件进行单词计数，展示了缓存数据的效果。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

废话少说直接上部署方案

部署方案,为了便于测试我将采用local的模式，master 和worker 都在同一个节点上,sprk-0.9.1.0

cd conf目录下配置spark-env.sh，添加如下配置项

export SPARK_MASTER_IP=hadoop00
export SPARK_WORKER_CORES=1
export SPARK_WORKER_INSTANCES=1
export SPARK_MASTER_PORT=7077
export SPARK_WORKER_MEMORY=1g
export MASTER=spark://${SPARK_MASTER_IP}:${SPARK_MASTER_PORT}
SPARK_MASTER_WEBUI_PORT=8090#修改访问集群监控的端口号，默认8080

配置slaves，添加运行worker的节点
hadoop00

启动spark集群（伪分布式单节点）

sbin/start-all.sh

通过UI页面查看是否启动成功，或者通过jps查看master和worker进程是否存在

运行测试程序，进入到spark shell下，需要制定进入spark的运行模式
spark运行的四种模式：Local、Standalone、Mesos、YARN

cd bin
在bin目录下执行，默认启动方式 ./spark-shell 是local模式(官方介绍在spark1.0默认启动模式是Standalone,但是实践证明spark1.0默认启动还是local模式)
MASTER=Local[2] ./spark-shell //启动本地模式，并指定两个线程来工作
或