debezium 的mysql插件+ schema registry(confluent)实现 avro 序列化
背景
avro 序列化与json序列化方式比较
默认的kafka的connect 使用的是一种json的方式完成的序列化。这种json的序列化的结构数据比较冗长。在kafka中存储数据的同时,也存储数据的其它结构信息(每条数据都要存储一遍),这样占用大量的空间。
confluent avro序列化的优点:
Avro模式将表的结构信息存储在schema registry中,所以在kafka每个记录只需要包含一个很小的模式标识符。这使得每条记录更小。对于像Kafka这样受I/O限制的系统,这意味着生产者和消费者的总吞吐量更高。
confluent 启用schema registry
下载confluent community 5.5并解压,修改confluent中的
vim etc/schema-registry/schema-registry.properties
参考的修改内容:

启动schema registry
schema-registry-start etc/schema-registry/schema-registry.properties
这个命令启动之后,将会启动一个schema registry

本文介绍了如何使用Debezium的MySQL插件结合Confluent Schema Registry实现Avro序列化,以提高Kafka数据存储效率。相较于JSON序列化,Avro序列化通过在schema registry存储结构信息,减少了记录大小,提高了吞吐量。文中详细阐述了启用Confluent Schema Registry的步骤,包括配置修改、启动服务、设置Kafka连接等,并展示了测试过程。
最低0.47元/天 解锁文章
861

被折叠的 条评论
为什么被折叠?



