datax hdfs2mysql.json模板

运行如下命令可以查看官方文档
datax.py  -r hdfsreader -w mysqlwriter

DataX (DATAX-OPENSOURCE-3.0), From Alibaba !
Copyright (C) 2010-2017, Alibaba Group. All Rights Reserved.
Please refer to the hdfsreader document:
     https://github.com/alibaba/DataX/blob/master/hdfsreader/doc/hdfsreader.md 
Please refer to the mysqlwriter document:
     https://github.com/alibaba/DataX/blob/master/mysqlwriter/doc/mysqlwriter.md 
hdfs2mysql.json
{
 "job": {
  "content": [
   {
    "reader": {
     "name": "hdfsreader",
     "parameter": {
      "column": [
       "*"
      ],
      "defaultFS": "hdfs://xxxx:8020",
      "encoding": "UTF-8",
      "fieldDelimiter": "|",
      "fileType": "text",
      "path": "/xxxx",
      "nullFormat":"\\N" #处理hdfs中的Null值
     }
    },
    "writer": {
     "name": "mysqlwriter",
     "parameter": {
      "column": [
       "xm",
       "total_days",
       "total_count",
       "avg_czcs",
       "preday_counts"
      ],
      "connection": [
       {
        "jdbcUrl": "jdbc:mysql://ip:port/db?useUnicode=true&characterEncoding=utf-8",
        "table": [
         "table_name"
        ]
       }
      ],
      "password": "密码",
      "preSql": [],
      "session": [],
      "username": "用户名",
      "writeMode": "insert"
     }
    }
   }
  ],
  "setting": {
   "speed": {
    "channel": "1"
   }
  }
 }
}

模板2: 如果不是所有列导出,需要指定列的对应关系,下标从0开始,
hdfsreader数字类型用long,用int会报错,type是必填字段

{
 "job": {
  "content": [
   {
    "reader": {
     "name": "hdfsreader",
     "parameter": {
      "column": [
       {
        "index": 0,
        "type": "long"
       },
       {
        "index": 6,
        "type": "long"
       },
       {
        "index": 7,
        "type": "long"
       },
       {
        "index": 4,
        "type": "double"
       }
      ],
      "defaultFS": "hdfs://",
      "encoding": "UTF-8",
      "fieldDelimiter": "|",
      "fileType": "text",
      "path": "/*",
      "nullFormat": "\\N"
     }
    },
    "writer": {
     "name": "mysqlwriter",
     "parameter": {
      "column": [
       "czrID",
       "total_count",
       "total_days",
       "avg_count"
      ],
      "connection": [
       {
        "jdbcUrl": "",
        "table": [
         "ttable"
        ]
       }
      ],
      "password": "",
      "preSql": [""],
      "session": [],
      "username": "",
      "writeMode": "insert"
     }
    }
   }
  ],
  "setting": {
   "speed": {
    "channel": "1"
   }
  }
 }
}
### DataX 配置文件 JSON 格式错误 (Common-00) 的修复方法 当遇到 DataX 运行时因配置文件非法 JSON 格式导致的 `Common-00` 错误时,可以按照以下方式排查并解决问题。 #### 1. 检查 JSON 文件语法 确保 `job.json` 文件遵循标准的 JSON 格式。常见的问题包括括号不匹配、逗号遗漏或多余、键值对未正确配对等。可以通过在线工具(如 https://jsonlint.com/)验证 JSON 文件的有效性[^1]。 #### 2. 路径校验 确认所有引用的路径均有效且无拼写错误。例如,在插件目录中的 reader 和 writer 插件路径应与实际安装位置一致。如果路径有变动,则需更新配置文件中的对应部分。 #### 3. 使用调试模式生成模板 通过命令行调用 DataX 来获取预定义的 JSON 模板作为参考: ```bash python datax.py -r {YOUR_READER} -w {YOUR_WRITER} ``` 上述命令会打印出一个基础的 JSON 结构供开发者调整和适配具体需求[^2]。 #### 4. 设置合理的 errorLimit 参数 为了避免少量的数据异常影响整个任务执行成功与否,可以在 job 配置中加入 `errorLimit` 字段来控制可接受的最大错误数量或比例: ```json { "setting": { "speed": {}, "errorLimit": { "record": 10, "percentage": 0.05 } }, ... } ``` 这里设置允许最多发生十次记录级别的错误以及不超过百分之五的整体差错率[^3]。 #### 5. 下载最新版本资源包 假如以上步骤仍无法排除问题,考虑下载最新的官方发行版替换现有环境可能存在的 bug 或者过期组件: ```bash wget http://datax-opensource.oss-cn-hangzhou.aliyuncs.com/datax.tar.gz tar zxvf datax.tar.gz cd datax/ ``` 完成升级后再尝试重新部署作业流程[^4]。 ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值