Azkaban 看这一篇就够了!任务调度平台的搭建,使用,以及API开发

本文详细介绍了Azkaban任务调度平台,包括其与Hadoop的关系、常见任务调度器对比、安装步骤、Web可视化平台的使用及API功能预览,适合需要集成Azkaban进行二次开发的读者。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

写在前面的话

当你的才华还撑不起你的野心时,那你就应该静下心来学习。每次脑子都会有很多
法,每次做了之后,还是觉得需要沉淀下来提升自己更加重要。著名的红叶子理论:一个人职业的成功不在于红叶子的数目多少,而在于他是否具备一片特别硕大的红叶子,这片特别硕大的红叶子不是与生俱来,需要个人的不断努力,准确地识别到最适合发展的红叶子。

本文内容较多,建议关注不迷路,更多优质内容等着你

在这里插入图片描述

目录大纲

0 写在前面的话

1.1 初识Azkaban

1.2 为什么需要任务调度器

1.3 常见几种任务调度器

1.4 Azkaban和Hadoop的关系

1.5 Azkaban 底层原理

2 Azkaban任务调度平台搭建

3 Azkaban Web可视化平台详细介绍以及使用

4 Azkaban API 功能预览

4.1 对接Azkaban,进行二次开发,使其嵌入到系统中

5 平台搭建中的问题总结

1.1 初识Azkaban

起源:Linkedin开源的一个批量工作流调度器
特征:一个工作流内,多个作业可以按照特定的顺序执行
依赖关系:作业之间的顺序关系依靠key-value的形式来建立依赖关系
可视界面:提供可视化web界面

官网:https://azkaban.github.io/

1.2 为什么需要任务调度器

定时任务的出现,可谓大大提高了工作效率。最简单的定时任务,就是你手机的闹钟,你给它一个定时任务,到了指定时间它就叫醒你。程序当中也是如此,那些反复繁琐的操作,可以交给任务调度器去执行,这样既能避免人为的失误,也能让工作人员从无意义的工作中解脱出来!

什么是工作流任务调度器?

很多时候,单一的任务并没有办法满足我们的业务需求,任务直接有关联性,这时候工作流就诞生了!

1.3 常见几种任务调度器

常见的几种工作流任务调度器介绍

Hamake:
  • 描述语言:xml
  • 依赖机制:data-driven
  • 不需要web容器
  • 支持hadoop 作业调度
  • 运行模式:command line utility
  • 事件通知:不支持
  • 无需安装
Oozie
  • 描述语言:xml
  • 依赖机制:explicit
  • 需要web容器
  • 不支持hadoop作业调度
  • 运行模式:daemon
  • 事件通知:不支持
  • 需要安装
Azkaban
  • 描述语言:text file with key/value pairs
  • 依赖机制:explicit
  • 需要web容器
  • 支持Hadoop 作业调度
  • 运行模式daemon
  • 事件通知:不支持
  • 需要安装
Cascading
  • 工作流描述语言:Java Api
  • 依赖机制:explicit
  • 不需要web容器
  • 支持hadoop 作业调度
  • 运行模式 API
  • 事件通知:有
  • 无需安装
市面上最流行的工作流任务调度器大致有以下这两种:
  • ooize
  • azkaban
下面就这两种,进行详细的阐述

ooize 偏重

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值