kafka中的常见问题处理

本文详细探讨了Kafka中防止消息丢失、避免重复消费、确保顺序消费以及处理消息积压和实现延时队列的策略,包括设置ack、使用幂等性、多线程消费和特殊主题设计等方法。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1. 如何防⽌消息丢失

  • ⽣产者:1)使⽤同步发送 2)把ack设成1或者all,并且设置同步的分区数>=2
  • 消费者:把⾃动提交改成⼿动提交

2. 如何防⽌重复消费

在防⽌消息丢失的⽅案中,如果⽣产者发送完消息后,因为⽹络抖动,没有收到ack,但实际上broker已经收到了。此时⽣产者会进⾏重试,于是broker就会收到多条相同的消息,⽽造成消费者的重复消费。

怎么解决

  • ⽣产者关闭重试:会造成丢消息(不建议)
  • 消费者解决⾮幂等性消费问题:
    所谓的幂等性:多次访问的结果是⼀样的。对于rest的请求(get(幂等)、post(⾮幂
    等)、put(幂等)、delete(幂等))
    解决⽅案
    1.在数据库中创建联合主键,防⽌相同的主键 创建出多条记录
    2.使⽤分布式锁,以业务id为锁。保证只有⼀条记录能够创建成功

在这里插入图片描述

3. 如何做到消息的顺序消费

  • ⽣产者:保证消息按顺序消费,且消息不丢失——使⽤同步的发送,ack设置成⾮0的值。
  • 消费者:主题只能设置⼀个分区,消费组中只能有⼀个消费者

kafka的顺序消费使⽤场景不多,因为牺牲掉了性能,但是⽐如rocketmq在这⼀块有专⻔的功能已设计好。

4. 如何解决消息积压问题

4.1 消息积压问题的出现

消息的消费者的消费速度远赶不上⽣产者的⽣产消息的速度,导致kafka中有⼤量的数据没有被消费。随着没有被消费的数据堆积越多,消费者寻址的性能会越来越差,最后导致整个kafka对外提供的服务的性能很差,从⽽造成其他服务也访问速度变慢,造成服务雪崩。

4.2 消息积压的解决⽅案

  • 在这个消费者中,使⽤多线程,充分利⽤机器的性能进⾏消费消息。
  • 通过业务的架构设计,提升业务层⾯消费的性能。
  • 创建多个消费组,多个消费者,部署到其他机器上,⼀起消费,提⾼消费者的消费速度
  • 创建⼀个消费者,该消费者在kafka另建⼀个主题,配上多个分区,多个分区再配上多个
    消费者。该消费者将poll下来的消息,不进⾏消费,直接转发到新建的主题上。此时,新
    的主题的多个分区的多个消费者就开始⼀起消费了。——不常⽤

5. 实现延时队列的效果

5.1 应用场景

订单创建后,超过30分钟没有⽀付,则需要取消订单,这种场景可以通过延时队列来实现

5.2 具体方案

在这里插入图片描述

  • kafka中创建创建相应的主题
  • 消费者消费该主题的消息(轮询)
  • 消费者消费消息时判断消息的创建时间和当前时间是否超过30分钟(前提是订单没⽀付)
    如果是:去数据库中修改订单状态为已取消。
    如果否:记录当前消息的offset,并不再继续消费之后的消息。等待1分钟后,再次向kafka拉取该offset及之后的消息,继续进⾏判断,以此反复。
### Kafka 集群常见故障及解决方案 #### 1. **Broker 启动失败** 当尝试启动 Kafka Broker 时,可能会遇到 `kafka.common.KafkaException` 错误。此错误通常是因为绑定地址配置不正确或端口已被占用。 - 解决方案: 检查 `server.properties` 文件中的 `listeners` 和 `advertised.listeners` 参数设置是否正确[^3]。确保指定的 IP 地址和端口号未被其他进程占用。可以通过命令 `netstat -anp | grep 9092` 来确认端口状态。如果发现冲突,则更改配置文件中的监听端口并重启服务。 #### 2. **消费者失去响应** Kafka 使用心跳机制来检测消费者的活跃性。如果消费者未能在设定的时间间隔 (`max.poll.interval.ms`) 内调用 `poll()` 方法,集群会将其视为失活,并触发重新平衡操作。 - 解决方案: 增加 `max.poll.interval.ms` 的值以允许更长的消息处理时间[^2]。或者优化消息处理逻辑,减少单条消息的处理耗时。此外,在业务线程繁忙的情况下,可以引入限流措施以控制消息接收速率[^4]: ```java while (kafkaProtoProcessManage.isBlocked()) { logger.warn("Kafka process list may be blocked, have a rest."); try { Thread.sleep(5000); } catch (InterruptedException e) { e.printStackTrace(); } } ``` #### 3. **分区不可用** 某些情况下,Kafka 分区可能变得不可用(Unavailability),这通常是由于副本同步问题或 Leader 副本失效引起的。 - 解决方案: 通过命令 `bin/kafka-topics.sh --describe --topic <topic-name> --bootstrap-server <broker-address>` 查看分区的状态。如果存在未同步的副本,需调整 `min.insync.replicas` 参数以提高可用性。同时,确保 Zookeeper 正常工作,因为它是管理元数据的核心组件[^1]。 #### 4. **磁盘空间不足** Kafka 是基于磁盘的日志存储系统,因此磁盘容量对于其性能至关重要。一旦磁盘接近满载,写入操作将会变慢甚至停止。 - 解决方案: 定期清理过期的数据,依据保留策略删除旧日志。可通过修改 `log.retention.hours` 或 `log.retention.bytes` 参数实现自动清除功能[^1]。另外,考虑水平扩展集群规模或将部分 Topic 数据迁移到更高容量的节点上。 #### 5. **网络延迟过高** 高网络延迟会影响生产者与消费者之间的通信效率,进而降低整体吞吐量。 - 解决方案: 评估当前网络环境是否存在瓶颈,必要时升级硬件设施或改善拓扑结构。启用压缩算法(如 Snappy、Gzip)能够有效减小传输负载大小。 --- ###
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值