源码
文章平均质量分 94
cigg153
大数据开发
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
从源码看flume采集的数据是如何进入到kafka主题的同一分区
00 背景 在实际开发过程中,会遇到希望将采集的数据进入到kafka主题的同一分区中的需求场景,为消费者消费数据提供便利,例如,同一会员的消费信息、浏览信息等等。 此篇主题是探讨flume采集的数据如何进入到kafka主题的同一分区,并且希望能够在为类似需求场景提供解决方案的时候,提供可复制的思路,起到举一反三的效果。 01 工具 flume官网 flume源码 kafka集群 flume 0...原创 2018-10-07 16:04:48 · 1815 阅读 · 0 评论 -
DataX使用记录
DataX使用记录 DataX 是阿里巴巴集团内被广泛使用的离线数据同步工具/平台,实现包括 MySQL、SQL Server、Oracle、PostgreSQL、HDFS、Hive、HBase、OTS、ODPS 等各种异构数据源之间高效的数据同步功能。 00特性 DataX本身作为数据同步框架,将不同数据源的同步抽象为从源头数据源读取数据的Reader插件,以及向目标端写入数据的Writer插件...原创 2019-06-29 19:33:27 · 633 阅读 · 0 评论
分享