Airflow的scheduling的start_date和schedular_interval
问题出现
Airflow是一个定时调度框架,最近公司需要用到airflow进行对脚本程序的调度。所以公司搭建了一个Airflow的平台,现在有一个任务需要在每天的18点02分执行,那么我们怎么做呢?
我们编辑了一个Airflow的python文档,(具体的代码就不放出来了)里面的内容大致如下:

在这个图里面,关注两个变量名称
* start_date
* schedule_intervel
现在需求是从2020-06-18 18:02:00开始程序的第一次执行,此后,程序将会在每一天的18:02:00这个时间点执行。
在实现这个需求之前,我们先做了一个针对Airflow的测试,测试的目的是想要验证一下Airflow能否正常的去执行。
测试过程
&emsp:&emsp:在开始之前,我们准备了一个shell脚本内容如下:
date >> mydate.txt
在北京时间为:2020-06-18 15:16:00的时刻下(当前时间2020-06-18 15:14:00),我们想要让这个shell脚本第一次执行,并且每五分钟执行一

本文探讨了Airflow调度中start_date和schedule_interval的使用,通过测试发现,start_date并不决定任务首次执行时间,而是从start_date加一个schedule_interval周期开始计算。实际第一次执行时间是start_date加上一个周期的next_execution_time。文章提供了测试案例和结论,强调正确理解schedule_interval表达式的重要性。
最低0.47元/天 解锁文章
1177

被折叠的 条评论
为什么被折叠?



