spark编译 && 安装

原创于 2021-10-11 10:07:49 发布 · 297 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#spark #scala #maven

bigdata 专栏收录该内容

60 篇文章

订阅专栏

本文档详细介绍了如何预编译和源代码编译Apache Spark。预编译版本涉及下载tar包，解压，配置环境变量及运行示例。源代码编译涉及设置 MAVEN_OPTS，使用maven构建，安装额外jar文件，并通过nohup执行make-distribution.sh脚本。编译完成后，你可以使用Spark的API进行二次开发。

1预编译版本

../spark-xx.xx.xx-bin-hadoopxx.xx.tgz

tar xvzf xx.tgz

mv xx /usr/soft配置环境变量

vi /etc/profile|evriment        $SPARK_HOME          PATH=$PATH:$SPARTK_HOME/bin

spark-shell local[n]          #n与服务器CPU的内核相同

     －－master IP               #主master

2源代码编译版本

下载 spark-1.6.1.tar 用maven安装spark-1.6.1.tar

export MAVEN_OPTS=“-Xmx512m -XX:MaxPemSize=128m”

mvn -Pyarn -Phadoop-2.6 -Dhadoop.version=2.6.4 -DskipTests clean package

mvn install:install-file  -Dfile='spark-streaming-mqtt_2.10-1.6.1.jar' -DgroupId='org.apache.spark' -DartifactId='spark-streaming-mqtt_2.10' -Dpackaging='jar' -Dversion='1.6.1'

export MAVEN_OPTS="-Xmx4g -XX:MaxPermSize=1024M -XX:ReservedCodeCacheSize=1024m"

nohup ./make-distribution.sh --tgz --skip-java-test -Dyarn.version=2.2.0 -Dhadoop.version=2.2.0 -Pyarn -Phive -Phive-thriftserver

－－－－－－

export MAVEN_OPTS="-Xmx4g -XX:MaxPermSize=1024M -XX:ReservedCodeCacheSize=1024m"

nohup ./make-distribution.sh --tgz --skip-java-test -Dyarn.version=2.6.4 -Dhadoop.version=2.6.4 -Pyarn -Phive -Phive-thriftserver