spark-2.2.2-bin-hadoop2.7 安装

Spark 2.2.2 安装步骤详解

最新推荐文章于 2022-07-26 14:45:00 发布

原创最新推荐文章于 2022-07-26 14:45:00 发布 · 3.5k 阅读

3 ·

CC 4.0 BY-SA版权

Spark 专栏收录该内容

19 篇文章

订阅专栏

本文详细介绍了如何安装Spark 2.2.2版本，包括上传安装包、解压、配置环境变量、修改配置文件如spark-env.sh和slaves，以及最后的分发和确认步骤。

1.上传spark-2.2.2-bin-hadoop2.7.tgz

2.解压文件

tar -zxvf spark-2.2.2-bin-hadoop2.7.tgz -C /usr/local/

3.进入conf/下把spark-env.sh.template改为spark-env.sh

cd /usr/local/spark-2.2.2-bin-hadoop2.7/conf/
mv spark-env.sh.template spark-env.sh

4.修改配置文件 spark-env.sh

1.编辑 spark-env.sh

vi spark-env.sh

2.修改内容如下

export JAVA_HOME=/usr/local/jdk1.8.0_211
export SPARK_MASTER_HOST=hadoop01
export SPARK_MASTER_PORT=7077

5.把slaves.template改为slaves

mv slaves.template slaves

6.修改配置文件slaves

1.编辑 slaves

vim slaves

2.修改内容如下

hadoop02
hadoop03

7.配置环境变量

1.编辑

vim /etc/profile

2.内容如下

export  SPARK_HOME=/usr/local/spark-2.2.2-bin-hadoop2.7
export  PATH=$PATH:$SPARK_HOME/bin:$SPARK_HOME/sbin

3.重置环境变量

source /etc/profile

8.分发到其他节点

scp -r /usr/local/spark-2.2.2-bin-hadoop2.7 hadoop02:/usr/local/
scp -r /usr/local/spark-2.2.2-bin-hadoop2.7 hadoop03:/usr/local/

9.OK

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

drl_blogs

关注关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

Hadoop2.7.3、spark2.2.2集群搭建

dont_run的博客

03-10

427

Hadoop2.7.3已经是很老的版本，也是刚学习Hadoop的时候接触到的第一个版本。这里简单记录一下部署方法，以操作手册的方式，不求对参数的绝对理解，只要顺着步骤来，就能完成搭建。

SparkV2.2.0_hadoop2.7.txt

04-17

spark-2.2.2-bin-hadoop2.7.tgz 百度网盘

参与评论您还未登录，请先登录后发表或查看评论

spark-2.2.0-bin-hadoop2.7

03-27

spark-2.2.0-bin-hadoop2.7

spark-2.2.2-bin-hadoop2.7.tgz

07-04

spark2.2.2安装包,原码包下载地址http://archive.apache.org/dist/spark/spark-2.2.2/

spark-2.2.1-bin-hadoop2.7.tgz

12-13

Apache Spark 是专为大规模数据处理而设计的快速通用的计算引擎。Spark是UC Berkeley AMP lab (加州大学伯克利分校的AMP实验室)所开源的类Hadoop MapReduce的通用并行框架，Spark，拥有Hadoop MapReduce所具有的优点；但不同于MapReduce的是——Job中间输出结果可以保存在内存中，从而不再需要读写HDFS，因此Spark能更好地适用于数据挖掘与机器学习等需要迭代的MapReduce的算法。

spark2.2.1+hadoop2.7.1伪分布式安装

Rocky

08-16

1258

环境说明:jdk1.8+scala.2.11.8+spark2.2.1+hadoop.2.7.1 spark2.2.1伪分布式安装说明：首先要安装好jdk+hadoop+scala 下载。上传、解压配置spark/conf/spark-env.sh 记得先把原始文件copy一份 cp spark-env.sh.temple spark-env.sh vim spark-env...

Hadoop2.7.5+Spark2.2.1分布式集群搭建

cmgx1986的博客

03-24

294

一、运行环境 CentOS 6.5 Spark 2.2.1 Hadoop 2.7.5 Java JDK 1.8 Scala 2.12.5 二、节点IP及角色对应关系节点名 ...

spark-2.2.2-bin-hadoop2.7.tgz 大数据.txt

07-29

spark-2.2.2-bin-hadoop2.7.tgz 安装包，大数据 spark

任务描述本关任务：安装与配置Spark开发环境。相关知识 Apache Spark是专为大规模数据处理而设计的快速通用的计算引擎。Spark是UC Berkeley AMP lab(加州大学伯克利分校的AMP实验室)所开源的类Hadoop MapReduce的通用并行框架，Spark拥有Hadoop MapReduce所具有的优点；但不同于MapReduce的是——Job中间输出结果可以保存在内存中，从而不再需要读写HDFS，因此Spark能更好地适用于数据挖掘与机器学习等需要迭代的MapReduce的算法。本关我们来配置一个伪分布式的Spark开发环境，与配置Hadoop类似分为三个步骤：下载解压安装包；配置环境变量；配置Spark环境；校验。下载解压安装包我们从官网下载好安装包，接下来解压，在平台已经将spark安装包下载到/opt目录下了，所以不需要再下载了。 tar -zxvf spark-2.2.2-bin-hadoop2.7.tgz -C /app 将压缩包解压到/app目录下。配置环境变量我们将spark的根目录配置到/etc/profile中（在文件末尾添加）。 vim /etc/profile 不要忘了source /etc/profile 修改Spark配置文件切换到conf目录下： cd /app/spark-2.2.2-bin-hadoop2.7/conf 在这里我们需要配置的是spark-env.sh文件，但是查看目录下文件只发现一个spark-env.sh.template文件，我们使用命令复制该文件并重命名为spark-env.sh即可；接下来编辑spark-env.sh，在文件末尾添加如下配置： export JAVA_HOME=/usr/lib/jvm/jdk1.8.0_111 export SCALA_HOME=/app/scala-2.12.7 export HADOOP_HOME=/usr/local/hadoop/ export HADOOP_CONF_DIR=/usr/local/hadoop/etc/hadoop export SPARK_MASTER_IP=machine_name # machine_name 根据自己的主机确定 export SPARK_LOCAL_IP=machine_name # machine_name 根据自己的主机确定参数解释：参数解释 JAVA_HOME Java的安装路径 SCALA_HOME Scala的安装路径 HADOOP_HOME Hadoop的安装路径 HADOOP_CONF_DIR Hadoop配置文件的路径 SPARK_MASTER_IP Spark主节点的IP或机器名 SPARK_LOCAL_IP Spark本地的IP或主机名如何查看机器名/主机名呢？很简单，在命令行输入：hostname即可。校验最后我们需要校验是否安装配置成功了；现在我们启动spark并且运行spark自带的demo：首先我们在spark根目录下启动spark：在spark的根目录下输入命令./sbin/start-all.sh即可启动，使用jps命令查看是否启动成功，有woker和master节点代表启动成功。接下来运行demo：在Spark根目录使用命令./bin/run-example SparkPi > SparkOutput.txt运行示例程序在运行的时候我们可以发现打印了很多日志，最后我们使用cat SparkOutput.txt可以查看计算结果（计算是有误差的所以每次结果会不一样）：好了，如果你能到这一步就已经完成了伪分布式Spark的安装啦。编程要求按照要求配置好Spark的开发环境，点击评测即可。

最新发布

10-22

将Spark安装包（/opt）解压到/app，安装目录为/app/spark-2.2.2-bin-hadoop2.7，使用以下命令： ```bash mkdir /app tar -zxvf /opt/spark-2.2.2-bin-hadoop2.7.tgz -C /app ``` ### 2. 配置环境变量到 /etc/profile...

spark-2.2.0-bin-hadoop2.7.zip

11-10

win10 下spark2.2.0+hadoop2.7.7+winutis 2

03-26

Windows上配置Python+Spark开发环境https://blog.csdn.net/qq_33283652/article/details/88790390

spark2.1.0-bin-hadoop2.7

07-06

spark-2.1.0-bin-hadoop2.7.tgz linux 安装文件。

spark2.0.2环境搭建（hadoop2.7.3）——启动关闭

archer的技术故事

12-17

4415

spark2.0.2环境搭建（hadoop2.7.3）——启动关闭本文主要讲述spark如何在hadoop环境下搭建。阅读完本文之后，能够正常的启动关闭spark。配置前提：配置好hadoop（hdfs和yarn都能正常）。下面，上货。首先去spark的官网上下载 1、下载完成后，解压到linux中 tar -zxvf spark-2.0.2-b

大数据平台搭建 Hadoop-2.7.4 + Spark-2.2.0 快速搭建

weixin_34319374的博客

09-22

227

Apache Spark 简介 Apache Spark 是专为大规模数据处理而设计的快速通用的计算引擎。Spark是UC Berkeley AMP lab (加州大学伯克利分校的AMP实验室)所开源的类Hadoop MapReduce的通用并行框架，Spark，拥有Hadoop MapReduce所具有的优点；但不同于MapReduce...

spark2.0+hadoop2.7.1简单部署

dataningwei的博客

03-11

1777

保证hadoop已经正常部署，以下为spark部署做个小笔记： 1、安装scala-2.11.8.tgz 1)tar -xvzf scala-2.11.8 mv scala-2.11.8 /usr 2)配置环境变量,在/etc/profile 中添加如下语句： export SCALA_HOME=/usr/scala-2.11.8

-bash: cd/: No such file or directory

Daylight629博客

04-23

1万+

-bash: cd/: No such file or directory shell脚本执行shell脚本时，./hello.sh 报上面错误， bash hello.sh 可以成功执行注意：#与！有一个空格 ”# !/bin/Bash“ 忽略双引号为了输出 #

Linux报错：-bash: 路径xx: No such file or directory解决方法