王炸组合:Dolphinscheudler 3.1.*搭配SeaT unnel2.3.*高效完成异构数据数据集成

file

概述

本篇主要介绍如何通过Dolphinscheduler海豚调度搭配Seatunnel完成异构数据源之间的数据同步功能,这个在大数据流批一体数仓建设的过程中是一个非常好的解决方案, 稳定高效,只要用上了你肯定爱不释手。

环境准备

  • dolphinscheduler集群 >= 3.1.5
  • dolphinscheduler3.1.5版本源码
  • Seatunnel集群 >= 2.3.3

没有安装好以上准备环境的童鞋,请先参考我的另外两篇文章完成基础环境搭建基于Seatunnel最新2.3.5版本分布式集群安装部署指南(小白版)及dolphinscheduler分布式集群部署指南(小白版)再回到章节继续。

配置文件修改

这里说明一下, 通过海豚调度配置的Seatunnel数据同步任务最后都会被分配到DS集群的某个Worker组或者某个worker节点上进行执行,所以你要保证你的DS集群的目标worker节点上也安装了Seatunnel服务。这很重要,因为实际dolphisncheduler中定义的seatunnel任务实例到最后都是需要调用worker节点上的seatunnel服务在本地执行seatunnel的任务启动命令来完成任务提交和运行。

Dolphinscheduler的配置文件修改

因为我们需要使用seatunnel完成数据集成,所以我们需要在dolphinscheduler的系统环境变量中将我们的Seatunnel的安装目录进行配置。

找到你的dolphinscheduler主节点的安装目录下的$DOLPHINSCHEDULER_HOME/bin/env/dolphinscheduler_env.sh

设置SEATUNNEL_HOME的访问目录,将SEATUNNEL_HOME设置为你自己的SeaTunnel安装目录。

export SEATUNNEL_HOME=${SEATUNNEL_HOME:-/opt/software/seatunnel-2.3.5}

然后保存重启Dolphinscheduler集群即可完成配置修改同步到所有的api-server、master-server及worker-server节点。

Dolphinscheduler部分源码修改

为什么要修改Dolphinscheduler的源码? 因为我这里使用的Seatunnel的版本是2.3.5,使用的引擎不是Seatunnel的默认引擎, 用的是Spark引擎, Spark我用的版本是2.4.5, 所有我最后在命令执行的命令如下:

$SEATUNNEL_HOME/bin/start-seatunnel-spark-2-connector-v2.sh --master local[4] --deploy-mode client --config /opt/software/seatunnel-2.3.5/config/app-config/v2.batch.config.template

如果我用的是Spark3.X的版本,我执行命令如下:

$SEATUNNEL_HOME/bin/start-seatunnel-spark-3-connector-v2.sh --master local[4] --deploy-mode client --config /opt/software/seatunnel-2.3.5/config/app-config/v2.batch.config.template

然而在Dolphinscheduler3.1.5版本的Seatunnel任务插件中,存在一些问题没办法兼容, 首先是前端,这里引擎只支持Spark和Flink,没有针对具体的版本进行兼容,没办法自由的选择使用Spark2、Spark3还是FIink13、Flink15。 file

其次就是后端的代码。 file

找到EngineEnum类, 修改一下代码如下:

ctrl+9创建do文件→输入下列文件 if _caller() >= 8 { window menu clear window menu append submenu "stUser" "&Meta-Analysis" window menu append item "Meta-Analysis" "Of Binary and Continuous (meta&n)" "db metan" window menu append item "Meta-Analysis" "Of Effects (&meta)" "db meta" window menu append item "Meta-Analysis" "Of p-values (meta&p)" "db metap" window menu append item "Meta-Analysis" "Cumulative (meta&cum)" "db metacum" window menu append item "Meta-Analysis" "Regression (meta&reg)" "db metareg" window menu append item "Meta-Analysis" "Funnel Graph, metan-based (f&unnel)" "db funnel" window menu append item "Meta-Analysis" "Funnel Graph, &vertical (metafunnel)" "db metafunnel" window menu append item "Meta-Analysis" "L'abbe Graph, metan-based (&labbe)" "db labbe" window menu append item "Meta-Analysis" "NNT, metan-based (metann&t)" "db metannt" window menu append item "Meta-Analysis" "Influence Analysis, metan-based (metan&inf)" "db metaninf" window menu append item "Meta-Analysis" "Influence Analysis, meta-based (metain&f)" "db metainf" window menu append item "Meta-Analysis" "Galbraith Plot for Heterogeneity (&galbr)" "db galbr" window menu append item "Meta-Analysis" "Publication Bias (meta&bias)" "db metabias" window menu append item "Meta-Analysis" "Trim and Fill Analysis (met&atrim)" "db metatrim" window menu refresh } run E:\w\stata1\ado\profile.do 结果输出 . insheet using C:\Users\51040\Desktop\metantry8.csv,clear (14 vars, 130 obs) . br . gen p=xtotal/xtail . gen se =sqrt(p*(1-p)/xtail) 如何在此基础上计算响应比
06-07
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

DolphinScheduler社区

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值