目的:实时同步mysql的数据,之前是通过flink-cdc实现,但是flink-cdc需要编写代码,维护起来相对来说较为麻烦。现在直接采用kafkaconnect来进行,操作简单便于维护
一、前期准备
软件版本
mysql 5.7.30
kafka 2.2.1-cdh6.3.2
Flink 12.2.2
Debezium连接器
debezium 1.5.0
相关介绍
Debezium是一个开源项目,为捕获数据更改(change data capture,CDC)提供了一个低延迟的流式处理平台。你可以安装并且配置Debezium去监控你的数据库,然后你的应用就可以消费对数据库的每一个行级别(row-level)的更改。
二、整体流程设计
图示如下
![[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-3WMTgxQO-1622107688994)(C:\Users\ADMINI~1\AppData\Local\Temp\1622095683852.png)]](https://i-blog.csdnimg.cn/blog_migrate/1f93c4fcad7c2a93ea58c7c88b22aa4b.png)
1、源数据位于mysql中
2、通过debezium捕获数据更改
3、传输mysql的变化信息
4、消费kafka,将其映射成为一张表
三、分步骤测试
1、kafka connnect启动与测试
1.1 进入kafka配置目录
cd /opt/cloudera/parcel

本文介绍了如何通过Kafka Connector的Debezium插件,实现实时从MySQL Binlog同步数据到Kafka,再利用FlinkSQL将Kafka中的数据映射为表。整个过程包括Kafka Connect的启动和配置、Debezium的安装、MySQL Binlog监控以及FlinkSQL的映射操作。
最低0.47元/天 解锁文章
633

被折叠的 条评论
为什么被折叠?



