方案比较
log解析 | SQL查询 | |
---|---|---|
全库同步 | 是 | 否 |
影响生产库 | 否 | 是 |
同步约束条件 | 否 | 只能按数字型timestamp /主键id 增量同步 (若直接用timestamp ,需要修改源码) |
log解析=>数据同步
- Oracle:ogg
- MySQL:binlog解析
SQL查询=>数据同步
- streamsets
- flume
-
方案
- flume-ng-sql-source读取数据:DB,file, hdfs…
- flume写入DB,hdfs
- flume写入kafka后期再消费
- docker试验
-
实施
- 安装
flume
[,kafka
,zookepper
] - 下载并生成
flume-ng-sql-source
的jar
包- 前提:
java
andmaven
- 进入
flume-ng-sql-source
并执行mvn package
- 前提:
- copy
flume-ng-sql-source-{version}.jar
到flume
是lib
下flume
- 安装
-