datax debug远程调试

本文详细介绍了如何使用IDEA进行DataX的远程调试,包括开启DataX远程debug模式的方法,以及在开发新插件数据源时如何利用此功能。DataX是阿里巴巴用于大规模数据导入的高效ETL工具。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

datax是一个高效的,支持多种数据源的ETL离线工具,阿里巴巴通过他每天导入3PB的数据,但是由于功能比较属于大众化,有一些不太满足各自的业务场景(如我们的需求在导入的过程中,需要kill掉回滚等),这时候就需要自己更改阿里的源码,需要下载源码,修改源码,调试,才便于定位问题。本文主要说idea怎么开启datax远程调试。供各位同行分析源码。

datax详细介绍及源码下载

开发新的插件数据源

datax开启远程debug模式

/apps/datax/bin/datax.py /apps/datax/job/237724067.json -d

即在后面添加-d 即可,默认端口为9999,也可以自行修改datax.py文件第35行

 REMOTE_DEBUG_CONFIG = "-Xdebug -Xrunjdwp:transport=dt_socket,server=y,address=9999"

在这里插入图片描述

idea远程监听9999端口

datax入口类:com.alibaba.datax.core.Engine
以下依次点击:
在这里插入图片描述

在这里插入图片描述

在这里插入图片描述
点击apply ,ok ,回到Engine类:

在这里插入图片描述
需要的地方打断点测试:

在这里插入图片描述
至此完成~!

评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值