Spark是现在应用最广泛的分布式计算框架,oozie支持在它的调度中执行spark。在我的日常工作中,一部分工作就是基于oozie维护好每天的spark离线任务,合理的设计工作流并分配适合的参数对于spark的稳定运行十分重要。
这个Action允许执行spark任务,需要用户指定job-tracker以及name-node。先看看语法规则:
本文介绍如何使用Oozie来调度Spark任务,并强调了合理设计工作流及参数配置的重要性。
Spark是现在应用最广泛的分布式计算框架,oozie支持在它的调度中执行spark。在我的日常工作中,一部分工作就是基于oozie维护好每天的spark离线任务,合理的设计工作流并分配适合的参数对于spark的稳定运行十分重要。
这个Action允许执行spark任务,需要用户指定job-tracker以及name-node。先看看语法规则:

被折叠的 条评论
为什么被折叠?