Kylin整个build过程分为两大步。
第一步为用户触发build事件,Kylin生成相关job并持久化到Hbase和缓存(内存)中;
第二步为调度引擎从缓存或者Hbase中轮训获取第一步放入的Job进行异步执行。
本文主要是对第一步的代码进行分析,方便大家学习找到入口的地方,第二步也会在后续更新。
Build第一步调用方法类图(核心步骤)
调用源码分析
- 页面: 点击build
- server-base: 进入org.apache.kylin.rest.controller.rebuild方法
- 检查本次提交是否合法
- 校验是否有权限 进入JobService.submitJob方法
- 有权限 进入JobService.submitJobInternal方法
- 根据Cube配置获得执行引擎 执行引擎是新建cube时在页面”Advanced Setting“步骤中填写的,默认是MR.Kylin目前有两种构造引擎(MR/Spark)。
- 构造Job 调用对应引擎类的build方法构造Job
- Build方法分析 下面具体分析MR 引擎的build方法,Spark引擎类似:
- 持久化Job
接下来继续看JobService.submitJobInternal方法,会对刚刚构建的对象进行持久化和放入缓存:
executableDao.addJobOutput(executableOutputPO)方法
executableDao.addJob(parse(executable));方法
- 返回结果
接下来继续看JobService.submitJobInternal方法,会查询出刚刚持久化的JobInstance并返回给controller,则本次提交结束。真正的运行由调度引擎进行job调度执行。后续更新调度引擎部分源码。