Kafka中的Offset偏移量+新老版本偏移量位置的改动

最新推荐文章于 2024-08-25 15:46:27 发布

学习时长两年半的小学生

最新推荐文章于 2024-08-25 15:46:27 发布

阅读量2.3k

点赞数 1

CC 4.0 BY-SA版权

分类专栏：数据库 Kafka

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/whiteBearClimb/article/details/111473382

本文详细介绍了Kafka中message的存储结构，包括Log文件的分段管理，以及偏移量在不同版本中的存储位置，从ZooKeeper到Kafka内置主题的变化。同时讨论了消费者偏移量的更新时机、可能遇到的问题以及手动与自动提交的权衡。最后提到了使用MySQL存储偏移量的考虑，并介绍了多消费组偏移量的区分方式以及如何消费偏移量主题。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

我们Kafka中的message，既然是写在XXXXXX.log文件中，不管存了多少数据，只要超过1G大小，就又开启一个新的Log文件存message，文件内部分多个segment分段（可以配置）。

在这里插入图片描述

文件命名就是segment分段的起始位置命名，例如：

第一个segment分段：0000000000.log（包含message0～37）、第二个segment分段0000000038.log（包含message38～75）、第三个segment分段00000000076.log（包含message76～113）… 第N个segment分段0000000369.log （包含message N-37～N），偏移量可以想象是书签，消费者重启后，继续从那一次消费的起点开始读取，例如假如上一次消费者A的偏移量是0000000029，证明消费到了29，掉线了，或者停止服务重启后就从0000000030开始消费，于是通过二分查找，发现30的message还属于segment 1这个分段，于是进入segment 1 继续二分，直到找到message 30。

上例子：

老版本Kafka（0.9以前）都存在ZooKeeper当中，之后的新版本都存在Kafka自带的一个偏移量主题当中：

查看当前Kafka的所有topics：
./kafka-topics.sh --list --zookeeper localhost:2181

在这里插入图片描述

可以看到确实有个偏移量的主题，文件的位置如果不做数据日志与系统日志分离，默认在Kafka内的logs，我的环境重新配置在了/kafka-logs文件夹中：

在这里插入图片描述

0～49，都是用来存消费者偏移量的主题文件。

我们自定义主题也会在这里出现：

./kafka-topics

最低0.47元/天解锁文章

200万优质内容无限畅学

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。