liunx安装spark

原创已于 2023-04-18 11:29:10 修改 · 1.6k 阅读

6 ·

CC 4.0 BY-SA版权

文章标签：

#linux #运维 #服务器 #spark

于 2023-03-27 14:39:03 首次发布

该文详细介绍了如何在VM虚拟机上安装Spark3.1.2，包括通过xftp导入安装包，解压到指定目录，配置环境变量，修改spark-env.sh文件，启动hadoop，以及使用spark-shell进行数据操作。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

一.spark安装包：

二.用xftp导入到vm虚拟机的/opt/install目录中，再在shell中ls展示：

三.解压spark至soft目录，并将其改名为spark312

四.配置spark的环境变量

五.配置spark312

在spark312/conf/目录下拷贝一份spark-env.sh.template并且重新命名为spark-env.sh

修改spark-env.sh

在74行下面配置spark

六.输入spark-shell进入黑窗口模式开始spark编写：

想从外部导包的话得先启动hadoop

将一个文件导入hadoop的tmp目录中

输入下面代码将workCount内容展示

一.spark安装包：

链接：https://pan.baidu.com/s/1hZ330QAwjvSGqGCgq_JqAg?pwd=9bt7
提取码：9bt7

二.用xftp导入到vm虚拟机的/opt/install目录中，再在shell中ls展示：

三.解压spark至soft目录，并将其改名为spark312

[root@gree2 install]# tar -zxf spark-3.1.2-bin-hadoop3.2.tgz -C ../soft
[root@gree2 install]# mv spark-3.1.2-bin-hadoop3.2/ spark312

四.配置spark的环境变量

[root@gree2 soft]# vim /etc/profile

#SPARK_HOME
export SPARK_HOME=/opt/soft/spark312
export PATH=$PATH:$SPARK_HOME/bin

五.配置spark312

在spark312/conf/目录下拷贝一份spark-env.sh.template并且重新命名为spark-env.sh

[root@gree2 conf]# cp spark-env.sh.template spark-env.sh

修改spark-env.sh

[root@gree2 conf]# vim ./spark-env.sh

在74行下面配置spark

export SCALA_HOME=/opt/soft/scala212
export JAVA_HOME=/opt/soft/jdk180
export SPARK_HOME=/opt/soft/spark312
export HADOOP_INSTALL=/opt/soft/hadoop313
export HADOOP_CONF_DIR=$HADOOP_HOME/etc/hadoop
export SPARK_MASTER_IP=gree2
export SPARK_DRIVER_MEMORY=2G
export SPARK_LOCAL_DIRS=/opt/soft/spark312

export SPARK_EXECUTOR_MEMORY=2G

需要搭建集群的话需要拷贝workers.template 并将其改名为workers，在workers中可以配置集群，我这里只配置单机版就不多撰写了