Spark源码环境搭建

本文介绍如何安装Scala、git、maven等开发工具,并使用IntelliJ IDEA导入Apache Spark 1.6.0的源代码进行编译与运行。文章详细说明了从GitHub获取源代码、配置编译参数以提高编译速度的过程,以及解决依赖问题的方法。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

提前安装一些开发工具
  • Scala 2.10.4
  • git 2.8.1
  • maven 3.3.9
  • IntelliJ IDEA 2015.02
源代码获取和编译

直接从官方的github上拉取代码
$ git clone git@github.com:apache/spark.git

$ git checkout v1.6.0

$ git checkout -b v160

编译源码

参考官方文档,我们这里使用4个线程,跳过tests,以便加快编译速度

$ build/mvn -T 4 -DskipTests clean package

这里写图片描述

$ spark-shell 测试一下

这里写图片描述

源码导入和代码运行

这里写图片描述

找到 example 中的 LocalPi.scala例子

这里写图片描述

在菜单栏点击Run -> Edit Configuration - 点击+ -> Application 配置如下

这里写图片描述

然后运行程序,程序会报错

然后运行程序,程序会报错

这里的报错是缺少依赖包,解决方法如下:

在菜单栏点击File -> Project Structure -> Modules -> 选择 spark-examples_2.11 -> Dependencies -> 点击+ -> 选择jars or directories

这里写图片描述

再次运行程序的时候可以看到正常输出

这里写图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值