
数据集成工具
文章平均质量分 90
flume,datax,flinkx...
纯欲天花板_
这个作者很懒,什么都没留下…
展开
-
数据集成工具之Flume的安装及使用
Flume 是一种分布式、可靠且可用的服务,用于高效地收集、聚合和移动大量日志数据。它具有基于流数据流的简单灵活的架构。它具有可调整的可靠性机制和许多故障转移和恢复机制,具有健壮性和容错性。它使用一个简单的可扩展数据模型,允许在线分析应用程序。原创 2021-12-09 19:03:11 · 612 阅读 · 0 评论 -
Kettle的安装及简单使用
Kettle是一款开源的ETL工具,纯java编写,可以在Window、Linux、Unix上运行,绿色无需安装,数据抽取高效稳定。原创 2021-12-10 20:52:19 · 331 阅读 · 0 评论 -
数据集成工具之FlinkX的安装与使用
FlinkX是在是袋鼠云内部广泛使用的基于flink的分布式离线和实时的数据同步框架,实现了多种异构数据源之间高效的数据迁移。原创 2021-12-08 10:20:03 · 3781 阅读 · 3 评论 -
数据集成工具之DataX的安装和使用
DataX 是阿里巴巴开源的一个异构数据源离线同步工具,致力于实现包括关系型数据库(MySQL、Oracle 等)、HDFS、Hive、ODPS、HBase、FTP 等各种异构数据源之间稳定高效的数据同步功能。本文介绍其安装及基本使用方法原创 2021-12-07 21:30:30 · 2094 阅读 · 0 评论 -
数据集成工具之SQOOP的安装及使用
Apache Sqoop(TM) 是一种工具,旨在有效地在Apache Hadoop和结构化数据存储(例如关系数据库)之间传输批量数据 。 本文主要介绍sqoop工具的安装以及简单使用方法。原创 2021-12-06 19:40:39 · 236 阅读 · 0 评论