
DataX
文章平均质量分 77
DataX使用简介
勤奋的ls丶
这个作者很懒,什么都没留下…
展开
-
数据同步之全量同步与增量同步
一、什么是数据同步业务数据是数据仓库的重要数据来源,我们需要每日定时从业务数据库中抽取数据,传输到数据仓库中,之后再对数据进行分析统计。为保证统计结果的正确性,需要保证数据仓库中的数据与业务数据库是同步的,离线数仓的计算周期通常为天,所以数据同步周期也通常为天,即每天同步一次即可。数据的同步策略有全量同步和增量同步。二、全量同步全量同步,就是每天都将业务数据库中的全部数据同步一份到数据仓库,这是保证两侧数据同步的最简单的方式...原创 2022-01-12 19:06:28 · 26810 阅读 · 5 评论 -
DataX的简介与使用
目录一、DataX的简介二、DataX支持的数据源三、架构介绍四、安装与使用同步MySQL数据到HDFS案例同步HDFS数据到MySQL案例一、DataX的简介DataX 是阿里巴巴开源的一个异构数据源离线同步工具,致力于实现包括关系型数据库(MySQL、Oracle等)、HDFS、Hive、ODPS、HBase、FTP等各种异构数据源之间稳定高效的数据同步功能。地址:Gitee 极速下载/alibaba datax二、DataX支持的数据源 ...原创 2022-01-10 20:52:39 · 3549 阅读 · 0 评论