spark编译 && 安装

本文档详细介绍了如何预编译和源代码编译Apache Spark。预编译版本涉及下载tar包,解压,配置环境变量及运行示例。源代码编译涉及设置 MAVEN_OPTS,使用maven构建,安装额外jar文件,并通过nohup执行make-distribution.sh脚本。编译完成后,你可以使用Spark的API进行二次开发。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1预编译版本

../spark-xx.xx.xx-bin-hadoopxx.xx.tgz

tar xvzf xx.tgz

mv xx /usr/soft配置环境变量

vi /etc/profile|evriment        $SPARK_HOME          PATH=$PATH:$SPARTK_HOME/bin

spark-shell local[n]          #n与服务器CPU的内核相同

     --master IP               #主master

2源代码编译版本

下载 spark-1.6.1.tar 用maven安装spark-1.6.1.tar

export MAVEN_OPTS=“-Xmx512m -XX:MaxPemSize=128m”

mvn -Pyarn -Phadoop-2.6 -Dhadoop.version=2.6.4 -DskipTests clean package

mvn install:install-file  -Dfile='spark-streaming-mqtt_2.10-1.6.1.jar' -DgroupId='org.apache.spark' -DartifactId='spark-streaming-mqtt_2.10' -Dpackaging='jar' -Dversion='1.6.1'

export MAVEN_OPTS="-Xmx4g -XX:MaxPermSize=1024M -XX:ReservedCodeCacheSize=1024m"

nohup ./make-distribution.sh --tgz --skip-java-test -Dyarn.version=2.2.0 -Dhadoop.version=2.2.0 -Pyarn -Phive -Phive-thriftserver

------

export MAVEN_OPTS="-Xmx4g -XX:MaxPermSize=1024M -XX:ReservedCodeCacheSize=1024m"

nohup ./make-distribution.sh --tgz --skip-java-test -Dyarn.version=2.6.4 -Dhadoop.version=2.6.4 -Pyarn -Phive -Phive-thriftserver

纯净版编译

使用-Pyarn或者-Pyarn-alpha编译出来的是一个完整的包,存放在./assembly/target/scala-2.10下,这个包包含了Spark编译得到的jar包,以及编译过程中所依赖的包。

如果你只想得到Spark的包,而不需要其依赖的Hadoop等,那么可以使用-Pbigtop-dist这个选项指定纯净版的profile(在./assembly/pom.xml中标识)。

编译得到Spark的jar包之后,你就可以调用其API进行二次开发啦!

参考

Building Spark - Spark 3.1.2 Documentation (apache.org)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

大怀特

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值