DataX之Hive-to-MySQL

最新推荐文章于 2024-10-13 10:43:46 发布

原创最新推荐文章于 2024-10-13 10:43:46 发布 · 1.1k 阅读

1 ·

CC 4.0 BY-SA版权

文章标签：

#hive #mysql

hive 同时被 3 个专栏收录

28 篇文章

订阅专栏

datax

19 篇文章

订阅专栏

MySQL

10 篇文章

订阅专栏

这是一个使用DataX从HDFS读取数据并插入到MySQL的脚本配置。脚本中，数据源为HDFS上的Hive表，目标是MySQL的t_copy表，采用insert模式写入，并在写入前清空目标表。

1、脚本

{
    "job": {
        "setting": {
            "speed": {
                "channel": 3
            }
        },
        "content": [
            {
                "reader": {
                    "name": "hdfsreader",
                    "parameter": {
                        "path": "/user/hive/warehouse/ods.db/t_copy/batch_no=20220221/*",
                        "defaultFS": "hdfs://node03:9000",
                        "column": ["*"],
                        "fileType": "text",
                        "encoding": "UTF-8",
                        "nullFormat":"",
                        "fieldDelimiter": "|"
                    }

                },
                "writer": {
                    "name": "mysqlwriter",
                    "parameter": {
                        "writeMode": "insert",
                        "username": "root",
                        "password": "123456",
                        "column": [
							"id",
							"test_bigint",
							"test_float",
							"test_DOUBLE",
							"test_TIMESTAMP",
							"test_date",
							"test_datetime",
							"test_string",
							"test_char",
							"test_text",
							"test_blob",
							"test_decimal"
                        ],
                        "session": [
                        	"set session sql_mode='ANSI'"
                        ],
                        "preSql": [
                            "truncate table t_copy"
                        ],
                        "connection": [
                            {
                                "jdbcUrl": "jdbc:mysql://node03:3306/test?useUnicode=true&characterEncoding=gbk",
                                "table": [
                                    "t_copy"
                                ]
                            }
                        ]
                    }
                }
            }
        ]
    }
}

2、执行脚本

 /opt/module/datax/bin/datax.py msyql_hive_ods_t_copy.json