DolphinScheduler——介绍及架构设计

目录

一、DolphinScheduler介绍

1.1 概述

1.2 特性

1.2.1 简单易用

1.2.2 丰富的使用场景

1.2.3 High Reliability

1.2.4 High Scalability

1.3 名词解释 

1.3.1 名词解释

1.3.2 模块介绍

二、DolphinScheduler架构原理

2.1 系统架构图

2.2 架构说明

2.2.1 MasterServer

2.2.2 WorkerServer

2.2.3 AlertServer

2.2.4 ApiServer

2.2.5 UI

2.2.6 ZooKeeper

2.3 架构设计思想

2.3.1 去中心化vs中心化

2.3.2 容错设计

2.3.3 任务失败重试

2.3.4 任务优先级设计

三、负载均衡

3.1 Worker 负载均衡算法

3.1.1 加权随机(random)

3.1.2 平滑轮询(roundrobin)

3.1.3 线性负载(lowerweight)

一、DolphinScheduler介绍

1.1 概述

     Apache DolphinScheduler 是一个分布式易扩展的可视化DAG工作流任务调度开源系统。适用于企业级场景,提供了一个可视化操作任务,工作流和全生命周期数据处理过程的解决方案。

     Apache DolphinScheduler (简称DS)旨在解决复杂的大数据任务依赖关系,并为应用程序提供数据和各种 OPS 编排中的关系。 解决数据研发ETL依赖错综复杂,无法监控任务健康状态的问题。DS以 DAG流式方式组装任务,可以及时监控任务的执行状态,支持重试、指定节点恢复失败、暂停、恢复、终止任务等操作。

官网文章地址:

     https://dolphinscheduler.apache.org/zh-cn/docs/3.2.1/about/introduction

集群部署流程见文章:

DolphinScheduler-3.2.0 集群搭建-优快云博客

1.2 特性

1.2.1 简单易用

  • 可视化 DAG: 用户友好的,通过拖拽定义工作流的,运行时控制工具
  • 模块化操作: 模块化有助于轻松定制和维护。

1.2.2 丰富的使用场景

  • 支持多种任务类型: 支持Shell、MR、Spark、SQL等10余种任务类型,支持跨语言,易于扩展
  • 丰富的工作流操作: 工作流程可以定时、暂停、恢复和停止,便于维护和控制全局和本地参数。

1.2.3 High Reliability

  • 高可靠性: 去中心化设计,确保稳定性。 原生 HA 任务队列支持,提供过载容错能力。 DolphinScheduler 能提供高度稳健的环境。

1.2.4 High Scalability

  • 高扩展性: 支持多租户和在线资源管理。支持每天10万个数据任务的稳定运行。

1.3 名词解释 

    这里整理的是调度系统常用的名词

1.3.1 名词解释

  • DAG: 全称 Directed Acyclic Graph,简称 DAG。工作流中的 Task 任务以有向无环图的形式组装起来,从入度为零的节点进行拓扑遍历,直到无后继节点为止。举例如下图:

  • 流程定义:通过拖拽任务节点并建立任务节点的关联所形成的可视化DAG
  • 流程实例:流程实例是流程定义的实例化,可以通过手动启动或定时调度生成。每运行一次流程定义,产生一个流程实例
  • 任务实例:任务实例是流程定义中任务节点的实例化,标识着某个具体的任务

  • 任务类型:目前支持有 SHELL、SQL、SUB_PROCESS(子流程)等

  • 调度方式:系统支持基于cron表达式的定时调度和手动调度。命令类型支持:启动工作流、从当前节点开始执行、恢复被容错的工作流、恢复暂停流程、从失败节点开始执行、补数、定时、重跑、暂停、停止、恢复等待线程。

  • 定时调度:系统采用quartz分布式调度器,并同时支持cron表达式可视化的生成

  • 依赖:系统不仅支持 DAG 简单的前驱和后继节点之间的依赖,同时还提供任务依赖节点,支持流程间的自定义任务依赖

  • 优先级 :支持流程实例和任务实例的优先级,如果流程实例和任务实例的优先级不设置,则默认是先进先出

  • 邮件告警:支持 SQL任务 查询结果邮件发送,流程实例运行结果邮件告警及容错告警通知

  • 失败策略:对于并行运行的任务,如果有任务失败,提供两种失败策略处理方式,继续是指不管并行运行任务的状态,直到流程失败结束。结束是指一旦发现失败任务,则同时Kill掉正在运行的并行任务,流程失败结束

 ps: 工作流--> 工作流实例, 一个工作流包含多个任务节点,任务节点 --> 任务实例

1.3.2 模块介绍

  • dolphinscheduler-master master模块,提供工作

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值