自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

北方的大数据之路

博客等级

码龄14年

46
原创

59
点赞

292
收藏

142
粉丝

关注

私信

热门文章

分类专栏

spark 14篇
kafka 1篇
调度系统 4篇
scala 1篇
udf 1篇
隐式转换 1篇
存储引擎 1篇
olap 2篇
标签平台 1篇
flink 1篇
实时数据 2篇
迁移 1篇
kylin 1篇
storm 1篇
算法 1篇
大数据 34篇

最新评论

浅谈大数据任务调度平台
qq_16425803: 小哥你的这个框架开源不有地址不
浅谈大数据任务调度平台
SONG%: 我的疑惑点是在依赖检查，文中有提到dagscheduler和taskscheduler都有依赖检查，这两者有什么联系与区别呢
浅谈大数据任务调度平台
北方~: 静态执行计划主要是为了页面执行计划和部分DAG的展示和预先持久化(动态生成的时候如果持久化需要浪费一些时间)。其实对于timeSchedule而言，到点执行的时候就会根据规则计算下一次的执行计划，并且丢到timeScheduler.（当然还有一种特殊情况，每次执行完后按照时间推迟调度。）
浅谈大数据任务调度平台
SONG%: 对于执行计划不知道我理解的是不是正确的。对于静态执行计划（提前一天生成）的调度，是不是只要将执行计划中的任务添加到timescheduler到点执行，在taskscheduler检查上游依赖实例是否生成，满足就执行。对于动态执行计划才需要dagscheduler辅助检查上游依赖并生成子节点下一次执行计划。
浅谈大数据任务调度平台
北方~: 其实为什么要这样做的。涉及到一个设计上的原则，其实任务实例一般是确定的。不可变的。上游依赖任务全部完成，我这边才叫任务实例，否则叫执行计划。这样设计的原因是为了临时更改任务的元数据以及依赖的时候，执行计划可以做到动态更新，但是任务实例是不更新的。

spark

关注

文章平均质量分 80

关注数：文章数：14 文章阅读量：11014 文章收藏量：25

作者: 北方~

这个作者很懒，什么都没留下…

展开