Spark基于zookeeper的HA

最新推荐文章于 2024-02-24 02:10:52 发布

原创最新推荐文章于 2024-02-24 02:10:52 发布 · 511 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

spark 专栏收录该内容

2 篇文章

订阅专栏

本文详细介绍如何在Spark中配置基于Zookeeper的高可用性(HA)设置。首先准备Zookeeper环境并完成Spark集群的基本配置，然后通过修改spark-env.sh文件来指定Zookeeper的相关参数。最后，通过实际操作验证当主节点发生故障时，备用节点能够成功接管成为新的主节点。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Spark基于zookeeper的HA

1. 准备

Zookeeper环境

参考：http://blog.youkuaiyun.com/mapengbo521521/article/details/41777721

Spark环境

参考：http://blog.youkuaiyun.com/mapengbo521521/article/details/49966677

2. 配置spark

进到spark的配置目录，在spark-env.sh修改如下

Export SPARK_DAEMON_JAVA_OPTS="-Dspark.deploy.recoveryMode=ZOOKEEPER -Dspark.deploy.zookeeper.url=hadoop1:2181,spark2:2181 -Dspark.deploy.zookeeper.dir=/spark"

export JAVA_HOME=/home/hadoop/jdk/jdk1.7.0_21

#export SPARK_MASTER_IP= hadoop1

#export SPARK_MASTER_PORT=7077

export SPARK_WORKER_CORES=1

export SPARK_WORKER_INSTANCES=1

export SPARK_WORKER_MEMORY=1g

把这个配置文件分发到各个节点上去

scp spark-env.sh root@hadoop2: $SPARK_HOME /conf/

scp spark-env.sh root@hadoop3: $SPARK_HOME /conf/

启动spark集群

Sbin/start-all.sh

进入hadoop2节点，启动start-master.sh 当hadoop1节点挂掉时hadoop2顶上充当master

jps查看hadoop1 和hadoop2 均存在Master进程

3. 测试HA是否生效

查看hadoop1 和hadoop2 均存在Master进程，hadoop2处于待命状态

在hadoop1上把master节点停掉 sbin/stop-master.sh

访问http://hadoop1:8080,发现已经挂掉。

访问http://hadoop2:8080,发现hadoop2已经已经接管了hadoop1成为主节点。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。