要安装和配置好spark,首先需要有JAVA环境,因为Spark是运行在JVM上的。但ubuntu 上的java默认是openjdk,我们需要自己下载安装和配置OracleJDK。而要用spark的python API,则要有python解释器,但是这个ubuntu里面已经自带了。所以配置spark的步骤大致如下:
(1)环境准备,安装oracleJDK,配置java和python环境变量
(2)安装scala(如果不使用scala开发,是否这一步可不用?)
(3)安装spark,配置spark环境变量
(4)验证安装情况
1.环境准备
安装Oracle JDK,到Oracle 官网http://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html下载64位linux版的安装包jdk-8u77-linux-x64.tar.gz,
进入下载文件夹,将下载的安装包放到特定目录下:

在64位Ubuntu上配置Spark,首先需安装OracleJDK,配置JAVA和PYTHON环境变量。接着,下载并安装Spark,设置SPARK_HOME和PYTHONPATH。通过验证pyspark启动,确保安装成功。若遇到'libjava.so'问题,可能需更换Java版本。
最低0.47元/天 解锁文章
1072

被折叠的 条评论
为什么被折叠?



