ETL调度工具JobStream功能及源代码

JobStream是一款作业调度系统,支持自动构建依赖关系流、作业优先级与并发数控制等功能。提供智能断点重跑、任务重试及邮件报警机制,确保作业高效稳定执行。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1 功能设计

1.1 功能图

 

1.2 功能介绍

1.2.1 自动构建依赖关系流

根据维护的Job的输入输出的hdfs路径,自动构建JOB之间依赖关系,一个JOB可能有多个输入路径,多个输出路径,那么一个Job可能依赖于多个Job执行成功完后才可执行

1.2.2 作业优先级的控制

调度系统按照作业优先级控制目前谁的Job优先执行,如果优先级一样,先执行提交时间早的JOB,对于一些重要的线上系统作业可设置高优先级

1.2.3 作业并发数的控制

控制同时正在运行的作业数,可根据系统情况自由调整

1.2.4 智能断点重跑

每日跑批作业,以项目为单元进行调度,一个项目包装很多作业,智能断点重跑要做的是当其中个别或部分作业出错,待技术人员调试解决后,需要重新跑批,系统自动执行上次出错作业的后续作业流,避免每个人都去手工补数据

1.2.5 任务出错重试机制

作业有可能因为当时外部因素,比如网络原因,未执行成功,并非自己本身bug,会给予机会重试。

1.2.6 任务出错邮件报警

数据库会记录所有程序运行的状态,有出错的任务立即给予报警

1.2.7 作业性能报表

结合记录的程序跑批日志,对运行时间长的做top排行,用于确定需要优化的作业


2 源代码

https://github.com/xmingyang/JobStream

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值