安装Spark集群

最新推荐文章于 2024-09-21 15:41:38 发布

刘小生Star

最新推荐文章于 2024-09-21 15:41:38 发布

阅读量441

点赞数 1

CC 4.0 BY-SA版权

分类专栏： Spark 大数据工具技能分享文章标签： Spark spark集群大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/xingxing1839381/article/details/80968340

大数据工具技能分享同时被 2 个专栏收录

7 篇文章

订阅专栏

1 篇文章

订阅专栏

1、下载相关文件

1）下载scala压缩包，进入链接http://www.scala-lang.org/

2）下载jdk压缩包，进入链接http://www.oracle.com/technetwork/java/javase/downloads/index.html，下载最新版jdk，若为64位系统请下载 jdk-8u91-linux-x64.tar.gz（本人下载版本为8u91，系统为64位）,32位系统下载 jdk-8u91-linux-i586.tar.gz，下载完成后解压到当前目录下。

3）下载spark压缩包，进入链接https://spark.apache.org/downloads.html，选择当前最新版本人为1.6.2，点击下载。

2、移动安装包并解压

1）将所有下载的文件首先存储在：/home/liuyanyun/resources

2）并进行解压文件：tar zxvf 文件名

3）将解压文件转移到/home/csu目录下

mv jdk1.8.0_60 /home/csu/jdk1.8.0_60

mv scala-2.12.6 /home/csu/scala-2.12.6

mv spark-1.6.1-bin-hadoop2.6 /home/csu/spark-hadoop

3、配置环境变量，编辑/etc/profile：sudo vi /etc/profile

#JDK

export JAVA_HOME=/home/csu/jdk1.8.0_60

export JRE_HOME=${JAVA_HOME}/jre

export CLASSPATH=.:${JAVA_HOME}/lib:${JRE_HOME}/lib

export PATH=${JAVA_HOME}/bin:${JRE_HOME}/bin:$PATH

# Scala

export SCALA_HOME=/home/csu/scala-2.12.6

export PATH=${SCALA_HOME}/bin:$PATH

# Spark

export SPARK_HOME=/home/csu/spark-hadoop/

#PythonPath

export PYTHONPATH=/home/csu/spark-hadoop/python

source /etc/profile，使配置文件生效

4、启动Scala

进入“/home/csu/scala-2.12.6”工作路径下，执行/bin/scala命令，即可启动Scala，退出scala（:quit），注意命令前面加：

5、Spark集群的安装与配置

1）配置Linux环境变量：vi ~/.bash_profile

## spark

export HADOOP_CONF_DIR=$HADOOP_HOME/etc/hadoop

export HDFS_CONF_DIR=$HADOOP_HOME/etc/hadoop

export YARN_CONF_DIR=$HADOOP_HOME/etc/hadoop

source ~/.bash_profile, 使配置文件生效

2）配置spark-env.sh环境变量，进入 /conf/spark-env.sh ，输入：

export SPARK_MASTER IP=192.168.35.100

export JAVA_HOME=/home/csu/jdk1.8.0_60/

export SCALA_HOME=/home/csu/scala-2.12.6/

exportSPARK_DAEMON_JAVA_OPIS='-Dspark.history.fs.logDirectory=hdfs:///user/spark'

3）配置slaves环境变量，进入 /conf/slaves ，输入：

master

slave0

4）将在master安装好的Spark复制到Slave节点

scp –r~/ spark-hadoop csu:slave0: /home/csu

6、 启动并验证 Spark

在master环境下，进入到Spark安装主目录下

(cd /home/csu/spark-hadoop)

执行sbin/start-all.sh

通过jps查看master和slave0上的进程，增加了一个Worker进程

netstat –nlopt ---查看打开的网络连接

7、进入Spark：./pyspark –masterspark://192.168.35.100:7077

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。