spark-2.1.1-bin-hadoop2.7的安装配置

本文详细介绍了如何在Hadoop环境中安装Spark 2.1.1,包括上传、解压、配置环境变量、修改spark-env.sh和slaves文件,以及同步文件至各个节点,确保Spark在集群中的正确运行。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

 配之前准备

将spark-2.1.1-bin-hadoop2.7.tgz安装包上传到xshell

在xshell上解压压缩包

输入解压命令:

tar -zxvf spark-2.1.1-bin-hadoop2.7.tgz

配置

1、配置环境变量

vim .bashrc

 在文件末尾添加如下内容:

#Spark
export SPARK_HOME=/home/hadoop/spark-2.1.1-bin-hadoop2.7
export PATH=${SPARK_HOME}/bin:$PATH

并将环境变量文件传到所有节点(以62为例)

scp -r .bashrc hadoop@10.103.105.62:/home/hadoop

使环境变量生效(每个节点都需要使环境变量生效)

source .bashrc

2、配置文件$SPARK_HOME/conf/spark-env.sh 

 cd spark-2.1.1-bin-hadoop2.7/conf
vim spark-env.sh

在文件末尾加上:

export SPARK_DIST_CLASSPATH=$(/home/hadoop/hadoop-2.7.6/bin/hadoop classpath)
export HADOOP_CONF_DIR=/home/hadoop/hadoop-2.7.6/etc/hadoop
export SPARK_MASTER_IP=10.103.105.62
export JAVA_HOME=/home/hadoop/jdk1.8.0_271
export SCALA_HOME=/home/hadoop/scala-2.12.13
export SPARK_WORKER_MEMORY=30G
export SPARK_WORKER_CORES=16
export SPARK_WORKER_INSTANCES=1
export SPARK_CONF_DIR=/home/hadoop/hadoop-2.7.6/etc/hadoop/
export SPARK_HISTORY_OPTS="-Dspark.history.ui.port=18080"
export SPARK_UI_PORT=4043

3、配置文件配置文件$SPARK_HOME/conf/workers

cd spark-3.1.1-bin-hadoop2.7/conf

vim slaves

去掉最后面的localhost,在文件末尾增加所有从节点的机器名

westgisB059
westgisB060
westgisB061
westgisB063

4、配置文件远程拷贝 

 spark-2.1.1-bin-hadoop2.7拷贝到每个节点(以62节点为例)

scp -r spark-2.1.1-bin-hadoop2.7 hadoop@10.103.105.62:/home/hadoop

其余操作和spark-3.1.1-bin-hadoop2.7类似

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值