kafka源码系列之mysql数据增量同步到kafka

最新推荐文章于 2025-07-06 14:29:42 发布

浪尖聊大数据-浪尖

最新推荐文章于 2025-07-06 14:29:42 发布

阅读量8.2k

点赞数 1

CC 4.0 BY-SA版权

分类专栏： kafka

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/rlnLo2pNEfx9c/article/details/80682269

一，架构介绍

生产中由于历史原因web后端，mysql集群，kafka集群(或者其它消息队列)会存在一下三种结构。

1，数据先入mysql集群，再入kafka

数据入mysql集群是不可更改的，如何再高效的将数据写入kafka呢？

A),在表中存在自增ID的字段，然后根据ID，定期扫描表，然后将数据入kafka。

B),有时间字段的，可以按照时间字段定期扫描入kafka集群。

C),直接解析binlog日志，然后解析后的数据写入kafka。

640?wx_fmt=png

2，web后端同时将数据写入kafka和mysql集群

640?wx_fmt=png

3，web后端将数据先入kafka，再入mysql集群

这个方式，有很多优点，比如可以用kafka解耦，然后将数据按照离线存储和计算，实时计算两个模块构建很好的大数据架构。抗高峰，便于扩展等等。

640?wx_fmt=png

二，实现步骤

1，mysql安装准备

安装mysql估计看这篇文章的人都没什么问题，所以本文不具体讲解了。

A),假如你单机测试请配置好server_id

B),开启binlog，只需配置log-bin

[root@localhost ~]# cat /etc/my.cnf

[mysqld]

server_id=1

datadir=/var/lib/mysql

socket=/var/lib/mysql/mysql.sock

user=mysql

# Disabling symbolic-links is recommended to prevent assorted security risks

symbolic-links=0

log-bin=/var/lib/mysql/mysql-binlog

[mysqld_safe]

log-error=/var/log/mysqld.log

pid-file=/var/run/mysqld/mysqld.pid

创建测试库和表

create database school character set utf8 collate utf8_general_ci;

create table student(

name varchar(20) not null comment '姓名',

sid int(10) not null primary key comment '学员',

majora varchar(50) not null default '' comment '专业',

最低0.47元/天解锁文章

200万优质内容无限畅学

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。