1.5.1.2 Spark的部署与安装

寒暄

于 2020-03-25 16:04:57 发布

阅读量164

点赞数

CC 4.0 BY-SA版权

分类专栏： # ---Spark-Core Spark-MLlib 文章标签： spark 大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/qq_41106844/article/details/105553316

---Spark-Core Spark-MLlib 专栏收录该内容

50 篇文章

订阅专栏

本文详细介绍了Spark的三种部署方式：单机模式、Spark-Mesos和Spark-YARN，并重点讲解了如何在Hadoop集群上搭建Spark 1.3.3完全分布式环境。包括安装前的软件需求、环境变量配置、关键配置文件修改及集群启动过程。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

总目录：https://blog.youkuaiyun.com/qq_41106844/article/details/105553392

Hadoop - 子目录：https://blog.youkuaiyun.com/qq_41106844/article/details/105553369

Spark的部署方式

单机Spark

一般用于测试。

Spark-Mesos

与Spark有血缘关系，性能匹配最好。

Spark-Yarn

基于Hadoop集群，这种实用性最广。

安装Spark

安装前准备：jdk8，hadoop2.7集群，scala2.10以上的软件包，spark2.X软件包。
本次安装基于1.3.3完全分布式搭建。
虽然spark是scala语言编写的，但是因为scala和java的混编特性，只要有java环境就可以安装spark了。
scala软件包解压和spark解压路径一致即可。
首先解压spark软件包：

解压

配置环境变量：
/etc/profile

环境变量

修改配置文件：
之后来到spark目录中的conf目录，这个目录里面放的就是spark所有的配置项。
这个目录中的文件都是以template结尾的模板文件，将slaves和spark-env.sh拷贝出来。

配置项

然后在slaves中添加所有节点。

slaves

然后配置我们的spark-env.sh：

配置

同时修改一下启动关闭项的名称，防止和hadoop的冲突。

修改启动项

传输到其他节点：

传输到slave1

传输到slave2

启动集群：

启动hadoop

启动spark

主节点jps

master是spark主节点标识，worker是任务容器。

从节点jps

从节点jps

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

寒暄 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。