搭建spark

最新推荐文章于 2023-04-19 09:31:25 发布

myd2561787

最新推荐文章于 2023-04-19 09:31:25 发布

阅读量233

点赞数

大部分转自(红色de石头):http://blog.youkuaiyun.com/red_stone1/article/details/71330101

说道大数据和机器学习，就少不了Spark.本文主要介绍在Linux下搭建单机环境的Spark的步骤。

安装Java SE

1、下载JAVA SE linux版本。下载地址为：
http://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html

注意选择Linux版本，根据机器类型选择32位或者64位。

2、下载jdk-8u131-linux-x64.tar.gz后，解压到自己指定目录。

$ tar -zxvf jdk-8u131-linux-x64.tar.gz -C /usr/lib/java
 
 1

3、配置JAVA环境变量。

打开.bashrc文件。

$ nano ~/.bashrc
 
 1

在.bashrc文件末尾增加如下内容：

export JAVA_HOME=/usr/lib/java/jdk1.8.0_131 
export JRE_HOME=${JAVA_HOME}/jre 
export CLASSPATH=.:${JAVA_HOME}/lib:${JRE_HOME}/lib 
export PATH=${JAVA_HOME}/bin:${JRE_HOME}/bin:$PATH 
 
 1
2
3
4

保存后退出，运行如下命令，使修改环境变量即可生效：

$ source ~/.bashrc
 
 1

4、检测java是否成功安装。

$ java -version
java version "1.8.0_131"
 
 1
2

如果显示了java安装的版本，则表示已正确安装，可以进行下一步了。

安装Scala

sudo apt-get install scala

4、检测scala是否正确安装。

$ scala -version
Scala code runner version 2.12.2 -- Copyright 2002-2017, LAMP/EPFL and Lightbend, Inc
 
 1
2

若显示如上信息，则表示scala已安装正确。

安装Spark

1、下载Spark的压缩文件。下载地址为：
http://spark.apache.org/downloads.html

2、下载spark-2.1.1-bin-hadoop2.7.tgz后，解压到指定的目录：

$ tar -zxvf spark-2.1.1-bin-hadoop2.7.tgz -C /opt/spark/
 
 1

3、配置scala环境变量。

打开.bashrc文件。

$ nano ~/.bashrc
 
 1

在.bashrc文件末尾增加如下内容：

export SPARK_HOME=/opt/spark/spark-2.1.1-bin-hadoop2.7
export PATH=${SPARK_HOME}/bin:$PATH 
 
 1
2

保存后退出，运行如下命令，使修改环境变量即可生效：

$ source ~/.bashrc
 
 1

4、检测spark是否正确安装。

$ spark-shell
 
 1

如果出现如下界面，则表示spark已正确安装：
这里写图片描述

安装sbt

1、下载Spark的压缩文件。下载地址为：
http://www.scala-sbt.org/download.html

2、下载sbt-0.13.15.tgz后，解压到指定的目录：

$ tar -zxvf sbt-0.13.15.tgz -C /opt/scala/sbt/
 
 1

3、配置sbt环境变量。

打开.bashrc文件。

$ nano ~/.bashrc
 
 1

在.bashrc文件末尾增加如下内容：

export SBT_HOME=/opt/scala/sbt
export PATH=${SBT_HOME}/bin:$PATH 
 
 1
2

保存后退出，运行如下命令，使修改环境变量即可生效：

$ source ~/.bashrc
 
 1

4、建立启动sbt的脚本。

$ mkdir /opt/scala/sbt/ 
$ cd /opt/scala/sbt/ 
$ touch sbt  
 
 1
2
3

脚本内容如下，注意sbt-launch.jar的路径

SBT_OPTS="-Xms512M -Xmx1536M -Xss1M -XX:+CMSClassUnloadingEnabled -XX:MaxPermSize=256M" 
java $SBT_OPTS -jar /opt/scala/sbt/bin/sbt-launch.jar "$@" 
 
 1
2

修改sbt文件的权限