记录一次hvie对接dolphinscheduler调用超时问题

本文讲述了将自建Hadoop集群和DolphinScheduler迁移至华为云MRS过程中遇到的挑战,包括DolphinScheduler与MRS的兼容性问题、Tez引擎的timeout问题以及Spark环境冲突。作者通过源码编译、配置调整和使用开源Hikari链接池解决了这些问题。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

业务需求:

将原有自建的hadoop集群以及hive、dolphinscheduler组建迁移至数据中台

遇见的问题:

在dolphinscheduler调用hive时,尤其是指定tez引擎运行相关的sql的时候会出现timeout的情况

版本

dolphinscheduler 2.0.9

大数据集群

huaweiIcloude hadoop 3.1.1-hw (MRS 3.0.X)

已经解决的问题有:

1.dolphinscheduler兼容性问题,MRS使用量存算分离,导致远端数据不能存储

原因:dolphinscheduler有scheme校验,在2.0.9时,桶文件系统仅支持s3,3.X版本支持阿里的文件系统
解决方式:1.将dolphinscheduler的源码编译使其支持obs协议,并相应的提升hadoop版本,最好是直接使用华为的相关jar进行编译,相关任务运行的脚本也要修改至支持obs
2.将华为大数据客户端的jar替换掉dolphinscheduler的jar
ps:两种方式均测试过,可以满足调度需求         

2.spark等环境冲突
 

解决方式:建议在调度集群中存在hadoopclient,直接调用和集群版本一致的组建版本

使用时遇到的最大问题:

dolphinscheduler调用hive时,尤其是指定tez引擎运行相关的sql的时候会出现timeout的情况

问题描述:

简单的sql,可以调通,文本较长的sql的,在制定tez引擎时,大概率出现timeout情况(集群/队列资源充足)

解决过程:
1.检查版本冲突,2.0.6 / 2.0.9重新构建后,问题仍在
2.检查配置文件,没有hive链接池的相关配置
3.最终锁定在Hikari,一个开源的链接池,dolphinscheduler并没有对其中的超时时间进行限制

搞!下载相应的开源版本,修改超时时间,替换,搞定!!

历时近半个月的加班结束!!!

相关jar 华为的建议直接拉取集群中 hikari如下,自取

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值