Airflow metastore清理

本文介绍如何使用Airflow命令行工具清理Airflow数据库中的过期statusrecord,包括指定清理时间戳和表名,以及作者作为数据科学领域的博士后,分享数据科学工具应用和交流资源。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

点赞发Nature
关注中Science

Airflow 运行中存在许多status record以table的形式保存的数据库中,需要定时清理:

用airflow command line tool可以进行清理:
airflow db clean --clean-before-timestamp <timestamp> -t <table_name> --dry-run -verborse -y

airflow metastore的table主要有

  • log
  • task_instance
  • dag_run
  • dag
  • task_fail
  • task_instance
  • xom

timestamp的格式为yyyy-mm-dd

譬如:
airflow db clean -clean-before-timestamp 2023-01-01 -t log
————————
我目前奥尔堡大学做博士后(我的google scholar, 我的Github),关注能源与环境数据科学。

专注于分享利用数据科学工具,欢迎一起交流、学习、合作。

关于我的博客内容、其他相关的研究问题,有问题可以下方👇评论、或私信我~

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值