Spark----Local模式的安装配置

最新推荐文章于 2025-04-22 09:40:07 发布

原创最新推荐文章于 2025-04-22 09:40:07 发布 · 865 阅读

2 ·

CC 4.0 BY-SA版权

Spark 专栏收录该内容

1 篇文章

订阅专栏

本文介绍了如何在本地模式下安装配置Spark 2.1.2，包括版本选型、下载解压、环境变量配置，并提供了测试步骤，如通过spark-shell进行Scala操作和访问WebUI。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

版本选型

spark2.1.2 ，依赖scala2.11.8

安装部署

下载spark-2.1.2-bin-hadoop2.7.tgz
解压安装：

进入需要安装的目录
		cd /home/wyc/apps    
通过共享文件夹，将安装包拷贝进入虚拟机
		cp /mnt/hgfs/sharefile/apache-spark/spark-2.1.2-bin-hadoop2.7.tgz .
解压安装包
		tar -zxvf spark-2.1.2-bin-hadoop2.7.tgz 
创建软链接
		ln -s spark-2.1.2-bin-hadoop2.7 spark

配置环境变量
修改【~/.bash_profile】,在文件尾部追加以下内容：

   #spark install
	export SPARK_HOME=/home/wyc/apps/spark
	export PATH=$SPARK_HOME/bin:$SPARK_HOME/sbin:$PATH

若不重启主机，运行以下命令，使环境配置生效

source ~/.bash_profile

至此，单机版搭建完成！
使用命令

 spark-shell

在这里插入图片描述

浏览器访问WebUI：HTTP://master:4040
在这里插入图片描述

spark-shell scala操作

scala> 2+3
res0: Int = 5

spark-shell命令介绍
–master:本地模式（默认）
local[*]:开启线程数

spark-shell local[4]        
--->spark并行处理4个线程，可以理解为4个节点同时在运行,
      用线程的方式模拟集群运行 默认并行度是1

退出spark shell

:q

在这里插入图片描述

测试

本地文件（包含内容）
运行spark-shell，加载本地文件

val file = sc.textFile("file:///home/wyc/sparkword.txt")

在这里插入图片描述

进行单词统计

file.flatMap(_.split(" ")).map((_,1)).reduceByKey(_+_).sortBy(_._2,false).collect

在这里插入图片描述