Azkaban的环境搭建
因为最近工作的需要,需要搭建一个可以支持Hadoop任务的调度系统,于是博主开始了Azkaban的挖坑活动。
Azkaban是一种类似于Oozie的工作流控制引擎,可以用来解决多个Hadoop计算任务之间的依赖关系问题。
本文分为如下几个部分说明搭建的过程:
- 搭建开发环境
- 导入sql文件
- 配置 azkaban-exec-server
- 配置azkaban-web-server*
搭建开发环境
准备的资源:
jdk1.7
ant(用来编译plugins)
azkaban-2.6.4.tar.gz
azkaban-plugins-2.6.4.tar.gz
选型:
我们选用2.6.4这样的旧版本主要是新版本编译的时候总是出现奇怪的问题。
编译azkaban-2.6.4.tar.gz
解压缩azkaban-2.6.4.tar.gz,放到你自己的${AZKABAN_HOME_COMPILE}目录下,在${ AZKABAN_HOME_COMPILE }目录下执行
./gradlew distTar
编译过程会出现createVersionFile的问题,我比较暴力的解决方法是去掉这一块的代码
比如把每一个project中的
task copy(dependsOn: [
'createVersionFile',
'copyLibs',
'copyDeps',
'copyPackage']) {
}
替换成
task c