flinkcdc、maxwell、canal
-
CDC是change data capture,核心思想是:监测并捕获数据库的变动(包括数据或数据表的插入、更新、删除等),将这些变更按发生的顺序完整记录下来,写入到消息中间件中以供其他服务进行订阅及消费。
-
CDC主要分为基于查询和基于binlog 两种方式。
-
- 基于查询:sqoop,批处理,不能捕捉所有数据变化,延迟较高,且增加了数据库的压力。
- 基于binlog:maxwell canal flinkcdc:流处理,能捕捉所有数据变化,低延迟,不增加数据库压力。
-
Maxwell是 实时读取mysql二进制日志binlog,并生成json格式的消息,作为生产者发送给kafka等。 把自己伪装程 mysql的一个slave,以slave的身份假装从master复制数据。
-
canal是同于java开发的 数据库增量日志解析,主要是对mysql 的binlog进行解析。
-
flinkcdc的优点:可以 多库多表,只要集群高可用&#