
大数据
文章平均质量分 52
奋斗者职场日记
这个作者很懒,什么都没留下…
展开
-
DataX开源同步工具技术简介
DataX 是阿里巴巴开源的一个离线同步工具,致力于实现包括关系型数据库(MySQL、Oracle 等)、HDFS、Hive、ODPS、HBase、FTP 等各种异构数据源之间稳定高效的数据同步功能。为了解决异构数据源同步问题,DataX 将复杂的网状的同步链路变成了星型数据链路负责连接各种数据源。当需要接入一个新的数据源的时候,只需要将此,便能跟已有的数据源做到无缝数据同步。原创 2024-11-12 09:43:32 · 284 阅读 · 0 评论 -
安装Hadoop
将 hadoop-3.2.4.tar.gz 导入到 opt 目录下面的 software 文件夹下面。进入到 Hadoop 安装包路径下,解压安装文件到/opt/module 下面。保存并退出: :wq。原创 2024-09-20 23:04:14 · 500 阅读 · 0 评论