Apache DolphinScheduler 快速入门指南
前言
Apache DolphinScheduler 是一款开源的分布式工作流任务调度系统,具有可视化操作界面、分布式调度能力、高可靠性和易扩展等特点。本文将带领初学者快速掌握 DolphinScheduler 的基本使用方法,通过构建一个简单的工作流来熟悉其核心概念和操作流程。
环境准备
在开始之前,需要确保已经完成 DolphinScheduler 的安装部署。对于初学者,推荐以下两种部署方式:
- Standalone 模式:适合本地开发和测试环境,部署简单快捷
- Docker 方式:通过容器化部署,环境隔离性好,适合快速体验
部署完成后,可以通过浏览器访问 Web UI(默认地址为 http://localhost:12345/dolphinscheduler/ui),使用默认账号 admin/dolphinscheduler123 登录。
核心概念解析
在开始创建工作流前,需要先理解几个关键概念:
1. 用户(User)
- 指登录系统的操作人员
- 拥有创建和管理工作流的权限
- 需要关联租户才能执行任务
2. 租户(Tenant)
- 任务的实际执行者
- 对应操作系统中的Linux用户
- 用于资源隔离和权限控制
3. 项目(Project)
- 工作流的组织单元
- 所有工作流都必须归属于某个项目
- 提供项目级别的资源隔离
实战:创建第一个工作流
第一步:创建租户
- 使用admin账号登录系统
- 进入"安全中心" -> "租户管理"
- 点击"创建租户"按钮
- 填写租户名称(建议使用小写字母和数字)
- 设置对应的Linux用户(需确保该用户已存在)
注意:如果没有关联租户,系统会使用默认租户"default"执行任务,这可能导致权限问题。
第二步:为用户分配租户
- 进入"安全中心" -> "用户管理"
- 找到目标用户(如admin)
- 点击"编辑"按钮
- 在下拉菜单中选择已创建的租户
- 保存更改
第三步:创建项目
- 点击顶部导航栏的"项目管理"
- 点击"创建项目"按钮
- 输入项目名称和描述
- 点击"提交"完成创建
第四步:创建工作流
- 进入刚创建的项目
- 点击"工作流定义"标签页
- 点击"创建工作流"按钮
- 系统会跳转到工作流编辑页面
第五步:添加任务节点
- 从左侧工具栏拖动"Shell"任务到画布
- 配置任务属性:
- 节点名称:建议使用有意义的名称
- 脚本内容:输入要执行的Shell命令
- 点击"确认"保存任务
- 重复上述步骤添加第二个任务
第六步:设置任务依赖
- 将鼠标悬停在第一个任务上
- 拖动箭头到第二个任务
- 释放鼠标建立依赖关系
- 点击右上角"保存"按钮
- 输入工作流名称完成保存
第七步:运行工作流
- 在工作流列表中找到刚创建的工作流
- 点击"上线"按钮使工作流可用
- 点击"运行"按钮启动工作流
- 系统会自动跳转到"工作流实例"页面
第八步:查看执行日志
- 在"工作流实例"列表中找到运行中的实例
- 点击实例名称进入详情页
- 右键点击任务节点
- 选择"查看日志"查看任务执行详情
总结
通过本教程,我们完成了以下关键操作:
- 理解了DolphinScheduler的核心概念
- 创建了必要的租户和项目
- 构建了包含两个Shell任务的简单工作流
- 设置了任务间的依赖关系
- 成功运行并查看了工作流执行结果
这只是一个简单的入门示例,DolphinScheduler还支持更复杂的场景,如定时调度、条件分支、参数传递等高级功能。掌握这些基础操作后,可以进一步探索系统的更多可能性。
创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考



