使用DataX进行数据同步

DataX 是一个异构数据源离线同步工具,可以实现数据源之间的数据同步。
ODPSWriter插件适合于TB,GB数量级的数据传输,如果需要传输PB量级的数据,可以选择dt task工具 ;

工具下载

使用方法

通过json文件进行配置,直接通过datax\bin下的datax.py文件启动
因为datax.py中的print方式为python2的方式,所以使用python2启动脚本。
python datax.py ..\job\job.json

官方git地址:https://github.com/alibaba/DataX

配置样例

  1. 内存同步到控制台
{
    "job": {
        "setting": {
            "speed": {"channel": 1}
        },
        "content": [
            {
                "reader": {
                    "name": "streamreader",
                    "parameter": {
                        "sliceRecordCount": 10,
                        "column": [ { "type": "long", "
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值