如何实现Dolphinscheduler YARN Task状态跟踪?

背景

Dolphinscheduler针对YARN任务,比如说MR、Spark、Flink,甚至是Shell任务,最初都是会判断如果有YARN任务,解析到applicationId。这样就会不单单以判断客户端进程为单一判断依据,还要根据YARN状态进行最终的Dolphinscheduler任务状态判断。后期,社区对此进行了重构(确实是好的向往,现在已经是半成品),但是导致了一些问题,比如说针对Flink Stream Application模式,这种客户端分离模式会让客户端Shell直接退出,所以现在Dolphinscheduler里面的任务就直接成功了。YARN上的任务还在运行呢,但Dolphinscheduler已经不能追踪到YARN上任务的状态了。

那么,想要实现对于YARN上任务的状态跟踪,可以怎么做呢?

注:以3.2.1版本为例。

Worker Task关系图

首先,让我们来看下DolphinScheduler中Worker Task的关系原理。

file

  • AbstractTask: 主要定义了Task的基本生命周期接口,比如说init、handle和cancel
  • AbstractRemoteTask: 主要对handle方法做了实现,体现了模版方法设计模式,提取了submitApplicationtrackApplicationStatus以及cancelApplication三个核心接口方法
  • AbstractYarnTask: 比如说YARN任务,就抽象了AbstractYarnTask其中submitApplicationtrackApplicationStatus以及cancelApplication可以直接是对YARN API的访问

AbstractYarnTask实现YARN状态跟踪

AbstractYarnTask可以实现YARN状态跟踪,参考org.apache.dolphinscheduler.plugin.task.api.AbstractYarnTask,完整代码如下 :

public abstract class AbstractYarnTask extends AbstractRemoteTask {

    private static final int MAX_RETRY_ATTEMPTS = 3;

    private ShellCommandExecutor shellCommandExecutor;

    public AbstractYarnTask(TaskExecutionContext taskRequest) {
        super(taskRequest);
        this.shellCommandExecutor = new ShellCommandExecutor(this::logHandle, taskRequest);
    }

    @Override
    public void submitApplication() throws TaskException {
        try {
            IShellInterceptorBuilder shellActuatorBuilder =
                    ShellInterceptorBuilderFactory.newBuilder()
                            .properties(getProperties())
                            // todo: do we need to move the replace to subclass?
                            .appendScript(getScript().replaceAll("\\r\\n", System.lineSeparator()));
            // SHELL task exit code
            TaskResponse response = shellCommandExecutor.run(shellActuatorBuilder, null);
            setExitStatusCode(response.getExitStatusCode());
            setAppIds(String.join(TaskConstants.COMMA, getApplicationIds()));
            setProcessId(response.getProcessId());
        } catch (InterruptedException ex) {
            Thread.currentThread().interrupt();
            log.info("The current yarn task has been interrupted", ex);
            setExitStatusCode(TaskConstants.EXIT_CODE_FAILURE);
            throw new TaskException("The current yarn task has been interrupted", ex);
        } catch (Exception e) {
            log.error("yarn process failure", e);
            exitStatusCode = -1;
            throw new TaskException("Execute task failed", e);
        }
    }

    @Override
    public void trackApplicationStatus() throws TaskException {
        if (StringUtils.isEmpty(appIds)) {
            return;
        }


        List<String> appIdList = Arrays.asList(appIds.split(","));
        boolean continueTracking = true;

        while (continueTracking) {
            Map
### 配置 DolphinScheduler 连接到 YARN 为了使 DolphinScheduler 能够连接到 YARN 并执行 Spark 作业,需要正确配置 `dolphinscheduler_env.sh` 文件中的环境变量以及在 DolphinScheduler 的 Web UI 中设置相应的参数。 #### 修改环境变量配置文件 编辑 `$DOLPHINSCHEDULER_HOME/conf/env/dolphinscheduler_env.sh` 文件,在其中添加或修改如下内容以指定 YARN 和 Hadoop 的路径: ```bash export HADOOP_CONF_DIR=/etc/hadoop/conf export SPARK_HOME=/path/to/spark-home ``` 这些配置确保了 DolphinScheduler 可以找到必要的 Hadoop 和 YARN 配置文件[^1]。 #### 设置 YARN 地址和其他必要属性 当创建一个新的 Spark 工作流定义时,可以在任务节点的高级选项里填写 YARN 相关的信息。具体来说,可以通过以下方式来设定 YARN Master URL: - **Master URL**: yarn - **Deploy Mode**: cluster 或 client (取决于实际需求) 此外,还需要上传所需的依赖包至 DolphinScheduler 的资源中心,比如之前打包好的 Python 环境 ZIP 文件以及其他可能需要用到的库[^4]。 #### 启动服务并验证配置 完成上述配置之后,重启 DolphinScheduler 的各个组件(API Server, Worker Server 等),以便让新的配置生效。可以使用命令行工具来进行操作,例如对于 worker server 来说就是运行下面这条指令[^2]: ```shell sh /opt/apache-dolphinscheduler-3.1.4/bin/dolphinscheduler-daemon.sh restart worker-server ``` 最后通过浏览器访问 DolphinScheduler 的 Web 控制台 (`http://<your_ip>:12345/dolphinscheduler/`) 登录后查看日志信息确认是否能够正常连接到 YARN 集群并提交任务[^3]。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

DolphinScheduler社区

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值