大数据调度平台 Airflow(四):Airflow WebUI 操作介绍

文章介绍了Airflow的WebUI操作,包括DAG的概念及其在GraphView、TreeView、CalendarView等视图中的展示,以及Security、Browse和Admin等模块的功能。DAG是Airflow的核心,用于构建任务依赖关系。用户可以通过不同视图监控任务状态、执行时长和重试次数等。Security涉及用户权限配置,Browse包含DAGRuns、Jobs等信息,Admin用于配置Airflow参数。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Airflow WebUI 操作介绍

一、DAG

DAG 有对应的 id,其 id 全局唯一,DAG 是 airflow 的核心概念,任务装载到 DAG 中,封装成任务依赖链条,DAG 决定这些任务的执行规则。

点击以上每个 DAG 对应的 id 可以直接进入对应“Graph View”视图,可以查看当前 DAG 任务执行顺序图。

以上“Runs”列与“Recent Tasks”列下的“圆圈”代表当前 DAG 执行的某种状态,鼠标放到对应的“圆圈”上可以查看对应的提示说明。点击以上“Links”之后,出现以下选项:

  • Tree View

将 DAG 以树的形式表示,如果执行过程中有延迟也可以通过这个界面查看问题出现在哪个步骤,在生产环境下,经常通过这个页面查看每个任务执行情况。

点击以上每个有颜色的“小块”都可以看到 task 详情:

  • Graph View

此页面以图形方式呈现 DAG 有向无环图,对于理解 DAG 执行非常有帮助,不同颜色代表 task 执行的不同状态。

点击任意一个 task,都可以看到当前 task 执行情况:

  • Calendar View

日期视图,显示当前年每月每天任务执行情况。

  • Task Duration

此视图表示不同的 task 在过去每天执行的时长,可以通过每日执行时长对比,发现同一个 task 执行耗时情况。

  • Task Tries

此视图显示每个 task 重试次数情况。

  • Landing Times

Landing Times 显示每个任务实际执行完成时间减去该 task 定时设置调度的时间,得到的小时数,可以通过这个图看出任务每天执行耗时、延迟情况。

以上得到的“Landing Times”如下:

  • Gantt

甘特图,可以通过甘特图来分析 task 执行持续时间和重叠情况,可以直观看出哪些 task 执行时间长。

  • Details

可以通过“Details”发现任务详细情况。

  • Code

Code 页面主要显示当前 DAG python 代码编码,当前 DAG 如何运行以及任务依赖关系、执行成功失败做什么,都可以在代码中进行定义。

二、Security

“Security”涉及到 Airflow 中用户、用户角色、用户状态、权限等配置。

三、Browse

  • DAG Runs

显示所有 DAG 状态

  • Jobs

显示 Airflow 中运行的 DAG 任务

  • Audit Logs

审计日志,查看所有 DAG 下面对应的 task 的日志,并且包含检索。

  • Task Instances

查看每个 task 实例执行情况。

  • Task Reschedules

Task 重新调度的实例情况。

  • SLA Misses

如果有一个或者多个实例未成功,则会发送报警电子邮件,此选项页面记录这些事件。

  • DAG Dependencies

查看 DAG 任务对应依赖关系。

四、Admin

在 Admin 标签下可以定义 Airflow 变量、配置 Airflow、配置外部连接等。

五、Docs

Docs 中是关于用户使用 Airflow 的一些官方使用说明文档连接。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值