基于Hadoop CDH进行Spark编译

最新推荐文章于 2021-09-18 15:18:23 发布

原创

最新推荐文章于 2021-09-18 15:18:23 发布 · 999 阅读

·

2

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

本文档介绍了如何在CDH环境下编译Apache Spark-2.4.0。首先从官方地址下载Spark源码，然后修改make-distribution.sh和pom.xml文件，特别是为CDH添加仓库。编译前需设置Maven内存使用，以防CompileFailed错误。成功编译后，解压并配置环境变量，最后可以本地启动Spark进行测试。

Spark-2.4.0下载地址：

官方地址：https://archive.apache.org/dist/spark/spark-2.4.2/spark-2.4.2.tgz

编译Spark源码的文档(参考官方文档)

http://spark.apache.org/docs/latest/building-spark.html

编译Spark源码的前置要求

软件	Hadoop	scala	maven	JDK
版本	2.6.0-cdh5.7.0	2.11.12	3.6.1	jdk1.8.0_45

编译与配置：

1解压Spark源码：

1

2

3

4

5

6

7

[hadoop@hadoop001 software]$ ll spark-2.4.2.tgz

-rw-r--r--. 1 hadoop hadoop 16165557 4月 28 04:41 spark-2.4.2.tgz

[hadoop@hadoop001 software]$ tar -zxvf spark-2.4.2.tgz

[hadoop@hadoop001 software]$ cd spark-2.4.2

2 修改make-make-distribution.sh中的版本号，避免编译时自己取寻找，此过程比较耗时

make-distribution.sh脚本的Github地址：

https://github.com/apache/spark/blob/master/dev/make-distribution.sh

1

2

3

4

5

6

7

8

9

10

11

12

13

最低0.47元/天解锁文章

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。