DataX的环境搭建以及简单测试
一、什么是DataX
DataX 是一个异构数据源离线同步工具,致力于实现包括关系型数据库(MySQL、Oracle等)、 HDFS、Hive、ODPS、HBase、FTP等各种异构数据源之间稳定高效的数据同步功能。
(这是一个单机多任务的ETL工具)
DataX的安装
一、前置条件
JDK(1.8以上,推荐1.8)
Python(推荐Python2.6.X)
Apache Maven 3.x (Compile DataX)
查看自有版本是否符合要求(下面附上安装链接)
JDK版本查看
java -version
Python版本查看(通常虚拟机自带版本2.x)
python --version
Maven版本查看
mvn -v
安装链接