Spark的编译

hadoop2015

于 2015-08-21 08:47:26 发布

阅读量415

点赞数

分类专栏： Spark

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/liujiyu1989/article/details/47829023

版权

Spark 专栏收录该内容

3 篇文章

订阅专栏

本文介绍了Spark的三种编译方式：SBT、Maven和打包编译，并详细阐述了打包编译的方法，包括需要的软件环境（JDK 1.7+、Maven 3.0.5、Scala 2.10），以及下载源码、解压缩和编译的步骤。最终通过`make-distribution.sh`脚本生成打包文件。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

由于Spark的运行环境的多样性，如可以运行在hadoop的yarn上，这样就必须要对Spark的源码进行编译。下面介绍一下Spark源码编译的详细步骤：

1、Spark的编译方式：编译的方式可以参考官网：https://spark.apache.org/docs/latest/building-spark.html

　　Spark的源码编译有三种方式：

　　（1）SBT（简单构建工具）方式；

　　（2）maven方式，这种编译方式是根据源码中的pom.xml文件来编译的，编译的方式是每个项目逐个编译，最后并不会生成一个打包好的文件；

　　（3）打包编译：make-distribution.sh ，这种方式实际上也是采用maven方式编译，但是最后会生成一个打包好的文件。因此，我们采用的是打包方式编译。

1、安装之前必须要准备的软件：

（1）JDK安装

　　其版本要求是JDK1.7+，由于Spark后期的版本不支持JDK1.6.因此需要安装JDK1.7+。

（2）maven 安装

　　其版本要求是3.0.5

（3）SCALA安装

　　其版本的要求是2.10的版本

2、下载Spark的源码。

　　进入官网下载：http://spark.apache.org/downloads.html

3、解压缩源码

　　tar -zxvf spark-1.3.1.tgz

4、编译：

（1）采用maven的方式编译：

  export MAVEN_OPTS="-Xmx2g -XX:MaxPermSize=512M -XX:ReservedCodeCacheSize=512m"

　　mvn -Pyarn -Phadoop-2.4 -Dhadoop.version=2.4.0 -DskipTests -Phive -Phive-thriftserver clean package

（2）采用打包的方式来编译：make-distribution.sh

　　./make-distribution.sh --tgz -Pyarn -Phadoop-2.4 -Dhadoop.version=2.4.0 -Phive -Phive-thriftserver

　　针对cdh的版本应该是：

　　./make-distribution.sh --tgz -Pyarn -Phadoop-2.4 -Dhadoop.version=2.6.0-cdh5.4.0 -Phive -Phive-thriftserver

（3）编译好之后会生成一个包：spark-1.3.0-bin-2.6.0-cdh5.4.0.tgz或者spark-1.3.0-bin-2.6.0.tgz

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。