EasyScheduler集群扩容与缩容操作指南

EasyScheduler集群扩容与缩容操作指南

dolphinscheduler dolphinscheduler 项目地址: https://gitcode.com/gh_mirrors/ea/EasyScheduler

前言

EasyScheduler作为一款分布式工作流任务调度系统,在实际生产环境中经常需要根据业务需求对集群进行扩容或缩容操作。本文将详细介绍EasyScheduler集群扩容和缩容的完整操作流程,帮助运维人员安全、高效地完成集群规模调整。

一、集群扩容操作

1. 扩容前准备

在进行扩容操作前,需要确保以下条件已满足:

  1. 硬件准备:新节点物理机已就绪,网络配置正确
  2. 软件依赖
    • JDK 1.8+已安装并配置环境变量
    • 如需扩容Worker节点,需预先安装Hadoop/Hive/Spark等客户端工具
  3. 版本一致性:获取与现有集群相同版本的EasyScheduler安装包

2. 创建部署用户

在所有新节点上创建专用部署用户并配置sudo权限:

# 创建用户
useradd dolphinscheduler;

# 设置密码
echo "dolphinscheduler123" | passwd --stdin dolphinscheduler

# 配置sudo免密
echo 'dolphinscheduler  ALL=(ALL)  NOPASSWD: NOPASSWD: ALL' >> /etc/sudoers
sed -i 's/Defaults    requirett/#Defaults    requirett/g' /etc/sudoers

重要说明

  • 部署用户需要sudo权限且配置免密
  • 如需资源上传功能,需在HDFS/MinIO上为该用户配置读写权限

3. 安装配置

  1. 安装包部署

    mkdir -p /opt
    tar -zxvf apache-dolphinscheduler-<version>-bin.tar.gz -C /opt 
    mv /opt/apache-dolphinscheduler-<version>-bin /opt/dolphinscheduler
    
  2. 配置文件同步

    • 从现有节点复制conf目录到新节点
    • 重点检查以下配置文件:
      • datasource.properties:数据库连接信息
      • zookeeper.properties:ZK连接信息
      • common.properties:资源存储配置
      • dolphinscheduler_env.sh:环境变量
  3. 环境变量配置示例:

    export HADOOP_HOME=/opt/soft/hadoop
    export JAVA_HOME=/opt/soft/java
    export PATH=$JAVA_HOME/bin:$HADOOP_HOME/bin:$PATH
    

4. 集群配置更新

修改所有节点上的bin/env/install_env.sh文件:

# 新增Master节点配置
masters="master01,master02,new_master01,new_master02"

# 新增Worker节点配置
workers="worker01:default,worker02:default,new_worker01:default,new_worker02:default"

5. 服务启动与验证

  1. 启动服务

    # 整体启动
    bin/start-all.sh
    
    # 或单独启动
    bin/dolphinscheduler-daemon.sh start master-server
    bin/dolphinscheduler-daemon.sh start worker-server
    
  2. 验证方式

    • 使用jps命令检查服务进程
    • 查看日志文件确认无报错
    • 在Web界面监控中心查看新增节点状态

二、集群缩容操作

1. 缩容前检查

  1. 确认要缩容的节点当前无正在运行的重要任务
  2. 检查集群整体负载情况,确保缩容后仍能满足业务需求

2. 服务停止流程

  1. 停止目标节点服务

    bin/dolphinscheduler-daemon.sh stop master-server  # Master节点
    bin/dolphinscheduler-daemon.sh stop worker-server  # Worker节点
    
  2. 验证服务停止

    • 使用jps命令确认对应服务进程已终止
    • 检查日志确认正常关闭

3. 集群配置更新

修改所有节点上的bin/env/install_env.sh文件,移除对应节点配置:

# 缩容后Master配置
masters="remaining_master01,remaining_master02"

# 缩容后Worker配置
workers="remaining_worker01:default,remaining_worker02:default"

三、注意事项

  1. 版本一致性:确保所有节点使用相同版本的EasyScheduler
  2. 配置文件同步:任何配置变更需要在所有节点同步
  3. 服务依赖:Worker节点需确保相关客户端工具配置正确
  4. 权限管理
    • 部署用户需要有sudo权限
    • 安装目录权限需正确设置
  5. 日志监控:操作后务必检查各节点日志确认无异常

四、常见问题处理

  1. 服务启动失败

    • 检查环境变量配置
    • 确认端口未被占用
    • 查看详细错误日志
  2. 节点状态异常

    • 检查网络连接
    • 验证ZK服务状态
    • 确认资源配置正确
  3. 任务执行问题

    • 检查Worker分组配置
    • 验证客户端工具版本兼容性

通过本文的详细指导,运维人员可以系统性地完成EasyScheduler集群的扩容和缩容操作,确保调度服务的稳定运行。建议在非业务高峰期进行操作,并提前做好完整备份。

dolphinscheduler dolphinscheduler 项目地址: https://gitcode.com/gh_mirrors/ea/EasyScheduler

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

乌芬维Maisie

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值