kafka-消息重复的场景及解决方案

本文详细分析了Kafka中生产者和消费者阶段的消息重复及丢失问题,包括生产者发送消息的重试机制导致的重复,以及消费者未及时提交offset可能造成的重复消费。针对这些问题,提出了启用幂等性、设置合适的ack和重试策略、手动提交offset等解决方案,以保证数据的准确性和一致性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

消息重复和丢失是kafka中很常见的问题,主要发生在以下三个阶段:

  1. 生产者阶段
  2. broke阶段
  3. 消费者阶段

生产者阶段重复场景

根本原因
生产发送的消息没有收到正确的broke响应,导致生产者重试。
生产者发出一条消息,broke落盘以后因为网络等种种原因发送端得到一个发送失败的响应或者网
络中断,然后生产者收到一个可恢复的Exception重试消息导致消息重复
在这里插入图片描述
说明:

  1. new KafkaProducer()后创建一个后台线程KafkaThread扫描RecordAccumulator中是否有消
    息;
  2. 调用KafkaProducer.send()发送消息,实际上只是把消息保存到RecordAccumulator中;
  3. 后台线程KafkaThread扫描到RecordAccumulator中有消息后,将消息发送到kafka集群;
  4. 如果发送成功,那么返回成功;
  5. 如果发送失败,那么判断是否允许重试。如果不允许重试,那么返回失败的结果;如果允许重
    试,把消息再保存到RecordAccumulator中,等待后台线程KafkaThread扫描再次发送
    可恢复异常说明
    异常是RetriableException类型或者TransactionManager允许重试;RetriableException类继承关
    系如下:
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值