Spark部署模式（一）——Local模式

最新推荐文章于 2025-04-21 10:25:41 发布

攻城狮Kevin

最新推荐文章于 2025-04-21 10:25:41 发布

阅读量8k

点赞数 3

CC 4.0 BY-SA版权

分类专栏： Spark 文章标签： Spark

本文链接：https://blog.youkuaiyun.com/wx1528159409/article/details/86621153

Spark 专栏收录该内容

47 篇文章

订阅专栏

本文深入讲解Spark的运行机制，包括单节点模式下的配置与优化，官方求π案例解析，WordCount实战演示，以及Driver和Executor的角色区分。揭示Spark运算流程，资源调度策略，和RDD缓存机制。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1. 官方求PI案例（直接运行已打成依赖jar包中的指定class）

2. 编写scala语言实现功能

3. 整个Spark运算的流程：

4. Spark中的Driver和Executor

5. 总结Spark中各种组成部分的关系

Local模式就是Spark运行在单节点的模式，通常用于在本机上练手和测试，分为以下三种情况：

（1）local：所有计算都运行在一个线程中；

（2）local[K]：指定K个线程来运行计算，通常CPU有几个Core（线程数），就指定K为几，最大化利用CPU并行计算能力；

（3）local[*]：自动设定CPU的最大Core数；

在API操作中体现在SparkConf的环节（配置信息），将Master（资源管理器）设定为哪种模式，对应几个线程：

 val conf = new SparkConf().setMaster("local[*]").setAppName("Application")

1. 官方求PI案例（直接运行已打成依赖jar包中的指定class）

首先启动单节点的HDFS（单节点已安装完毕Spark和Hadoop）

[kevin@hadoop100 spark]$ bin/spark-submit \
> --class org.apache.spark.examples.SparkPi \
> --executor-memory 1G \
> --total-executor-cores 2 \
> ./examples/jars/spark-examples_2.11-2.1.1.jar \
> 100

bin/spark-submit是Spark的bin目录下一个提交任务脚本

executor-memory，是给executor（具体计算功能的承担者）分配1G的内存

total-executor-cores，指定每个executor使用的cup核数为2个

最后的jar包是已经打成依赖的jar包；这个jar包可以是本地、也可以是HDFS中hdfs://、也可以是来自文件系统file:// path

运行结果如下，该算法是利用蒙特·卡罗算法求PI

Pi is roughly 3.1409291140929114

2. 编写scala语言实现功能

这里写一个WordCount的测试Demo程序：

（1）在spark/input目录下，创建1.txt和2.txt文件

[kevin@hadoop100 input]$ cat 1.txt 
hello spark
hello world
[kevin@hadoop100 input]$ cat 2.txt
hello hi
kevin spark

（2）启动spark-shell

[kevin@hadoop100 spark]$ bin/spark-shell
....
scala>

（3）运行WordCount的scala程序

scala> sc.textFile("input").flatMap(_.split(" ")).map((_,1)).reduceByKey(_+_).collect
res0: Array[(String, Int)] = Array((world,1), (kevin,1), (hello,3), (spark,2), (hi,1))

textFile("input")：读取本地文件，spark/input文件夹数据；

flatMap(_.split(" "))：压平操作，按照空格分割符，将文件每一行数据映射（Map）成一个个单词；

map((_,1))：对每一个单词操作，将单词映射为元组(单词，1)；

reduceByKey(_+_)：形同key的value值进行聚合，相加；

collect：将数据收集到Driver端展示。

（4）登录4040端口，可以查看DAG图