Kylin整个build过程分为两大步。
第一步为用户触发build事件,Kylin生成相关job并持久化到Hbase和缓存(内存)中;
第二步为调度引擎从缓存或者Hbase中轮训获取第一步放入的Job进行异步执行。
本文主要是对第一步的代码进行分析,方便大家学习找到入口的地方,第二步也会在后续更新。
Build第一步调用方法类图(核心步骤)

调用源码分析
- 页面: 点击build
- server-base: 进入org.apache.kylin.rest.controller.rebuild方法


- 检查本次提交是否合法

- 校验是否有权限 进入JobService.submitJob方法

- 有权限 进入JobService.submitJobInternal方法

- 根据Cube配置获得执行引擎 执行引擎是新建cube时在页面”Advanced Setting“步骤中填写的,默认是MR.Kylin目前有两种构造引擎(MR/Spark)。

- 构造Job 调用对应引擎类的build方法构造Job


- Build方法分析 下面具体分析MR 引擎的build方法,Spark引擎类似:

- 持久化Job
接下来继续看JobService.submitJobInternal方法,会对刚刚构建的对象进行持久化和放入缓存:


executableDao.addJobOutput(executableOutputPO)方法

executableDao.addJob(parse(executable));方法

- 返回结果
接下来继续看JobService.submitJobInternal方法,会查询出刚刚持久化的JobInstance并返回给controller,则本次提交结束。真正的运行由调度引擎进行job调度执行。后续更新调度引擎部分源码。


本文围绕Kylin的Build流程展开,介绍了Build第一步调用方法类图及核心步骤。从页面点击build开始,进入相关方法检查提交合法性、校验权限,根据Cube配置获取执行引擎(MR/Spark)构造Job,还分析了MR引擎的build方法,最后对构建对象持久化、缓存并返回结果,真正运行由调度引擎执行。
761

被折叠的 条评论
为什么被折叠?



