Azkaban Executor 设置任务并行度
1.问题描述
最近使用Azkaban进行Hive的任务调度,工作流结构如下

其中每一层都是一个工作流,每一层并行任务最少有5个,最多有二十多个,下一层执行依赖于上一层,但是在实际执行过程中,同一层最多只有10个任务并行执行。
2.问题分析
查看Yarn的Schedular,发现资源并不紧缺,联想到这是Azkaban的配置问题。
查看AzkabanExecutorConfiguration参数配置,发现需要重新设置flow.num.job.threads,该参数表示同一个工作流中任务执行的最大并行度,默认值为10。
3.问题解决
进入azkaban-exec-server的conf目录下vim azkaban.properties编辑AzkabanExecutor的配置文件,在末尾添加,所有的AzkabanExecutor节点均需要做如下配置
# 设置工作流最大并行度为30,按照实际情况设置
# 工作流最大并行度过大会导致AzkabanExecutor分配任务速度降低
flow.num.job.threads=30

本文介绍如何通过调整Azkaban的flow.num.job.threads参数来提高任务并行度,解决Azkaban任务调度中并行任务数量受限的问题。
最低0.47元/天 解锁文章
3522

被折叠的 条评论
为什么被折叠?



