
数据采集
大数据那些事
公众号(大数据技术与应用实战),分享一些在工作和学习过程中的大数据实战案例
展开
-
mysql日志解析工具canal介绍
文章转自https://github.com/alibaba/canal/wiki/Introduction背景早期,阿里巴巴B2B公司因为存在杭州和美国双机房部署,存在跨机房同步的业务需求。不过早期的数据库同步业务,主要是基于trigger的方式获取增量变更,不过从2010年开始,阿里系公司开始逐步的尝试基于数据库的日志解析,获取增量变更进行同步,由此衍生出了增量订阅&消费的业务转载 2017-10-12 15:07:17 · 4673 阅读 · 0 评论 -
阿里云开源离线同步工具DataX3.0介绍
文章转自 https://github.com/alibaba/DataX/wiki/DataX-Introduction阿里云开源离线同步工具DataX3.0介绍一. DataX3.0概览 DataX 是一个异构数据源离线同步工具,致力于实现包括关系型数据库(MySQL、Oracle等)、HDFS、Hive、MaxCompute(原ODPS)、HBa转载 2017-10-12 15:13:42 · 982 阅读 · 0 评论