Spark Standalone模式安装

最新推荐文章于 2025-04-23 16:00:36 发布

原创最新推荐文章于 2025-04-23 16:00:36 发布 · 286 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#spark #大数据 #hadoop

大数据专栏收录该内容

5 篇文章

订阅专栏

本文详细介绍如何在CentOs 7.5环境下安装Spark 2.3.1，并配置其与Hadoop 2.7.3协同工作。通过创建用户、设置环境变量等步骤完成安装流程，最终实现Spark的单机运行。

CentOs下安装Spark：

安装环境：
Linux：CentOs 7.5
Spark：2.3.1
Hadoop：2.7.3
下载：
Spark：http://spark.apache.org/downloads.html
本文选择版本：
https://archive.apache.org/dist/spark/spark-2.3.1/
在这里插入图片描述

安装：

新建分组机用户

## 新建用户
useradd hadoop
## 设置密码
passwd hadoop
## 切换到hadoop用户
su - hadoop
mkdir hd
cd hd
## 解压上传的安装文件
tar zxvf spark-2.3.1-bin-hadoop2.7.tgz
mv spark-2.3.1-bin-hadoop2.7 spark-2.3.1
cd spark-2.3.1
## 修改文件权限
chmod 775 * -R
## 修改配置
cd conf/
cp spark-env.sh.template spark-env.sh

2.修改配置文件
在spark-env.sh中添加环境变量

export JAVA_HOME=/home/hadoop/hd/jdk1.8.0_144
export SPARK_MASTER_IP=localhost
export SPARK_WORK_MEMORY=1g
## hadoop安装的目录, hadoop安装参考hadoop的伪分布式安装步骤
export SPARK_CONF_DIR=/home/hadoop/hd/hadoop-2.7.3/etc/hadoop
## 如果需要使用Scala还可以加入Scala的环境变量