spark 3.0 集群配置

最新推荐文章于 2023-05-13 13:56:10 发布

夕秋一梦

最新推荐文章于 2023-05-13 13:56:10 发布

阅读量1.6k

点赞数

分类专栏： linux

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/qq_39314099/article/details/103808046

版权

linux 专栏收录该内容

48 篇文章

订阅专栏

下载spark安装包：https://spark.apache.org/downloads.html

下载对应hadoop版本的spark即可。

解压，得到目录如下：

配置环境变量。依然采用在/etc/profile.d/下创建spark.sh。

配置spark：

进入conf文件夹，复制配置文件的模板，命名为spark-env.sh。

cp spark-env.sh.template spark-env.sh

前提是需要配置好java、scala、hadoop。

spark-env.sh文件只需要在尾部追加一点配置：

同样复制slaves的模板，命名为slaves。

cp slaves.template slaves

slaves需要指定集群的机器hostname，和hadoop配置过程一样。

将spark文件夹发送到其他机器上。

防火墙我已经在配置hadoop的时候处理过，方法是建立了机器之间的内部信任关系。

配置hadoop地址：https://blog.youkuaiyun.com/qq_39314099/article/details/103681298

启动：

进入sbin目录，和hadoop一样，使用start-all.sh脚本来启动。

可以在浏览器访问：

CentOS121:8080

可以在命令行开启spark-shell：

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。