Kafka总结

本文深入解析Kafka分布式消息系统的架构与核心组件,包括broker、producer、consumer、topic及partition的概念与作用。同时,提供了Kafka集群搭建步骤与常见命令操作指南,如创建topic、查看topic描述、消息生产和消费等。
  •  Kafka

  • Kafka:Kafka是分布式消息系统,将消息持久化到磁盘,默认保存一周
  • 概念
    • broker:broker是组成Kafka集群的节点,负责消息读写、存储,broker之间没有主从关系,一个broker可以管理多个partition
    • producer:消息生产者,producer两种机制【自己决定写往哪个topic中的那个partition】:hash、轮询
    • consumer:消息消费者,消费者自己维护消费者偏移量,consumer有各自的消费者组,不同组之间消费相同的topic互不影响。相同的消费组内的消费者,消费同一个topic数据,这个topic中相同的消息只能被消费一次
    • topic:topic是一类消息 / 消息队列,topic由partition组成,创建的时候可以指定,
    • partition:partition是组成topic的单元,在broker中,每个partition有副本,创建topic的时候可以指定,每个partition由一个broker管理
    • ZooKeeper:存储原数据,包含consumer消费偏移量+broker信息+partition信息+topic信息
  • Kafka集群搭建https://blog.youkuaiyun.com/Future_LL/article/details/87941627
    • 上传解压Kafka压缩包
    • 修改配置文件 vim server.properties
      • broker.id:配置每个broker的信息
      • log.dirs:配置真实数据存储位置
      • zookeeper.connect = IP1:2181,IP2:2181,IP3:2181
    • 每台broker都要启动:./bin/kafka-server-start.sh config/server.properties
  • 命令
    • 查看集群有哪些topic:./kafka-topics.sh --zookeeper IP1:2181,IP2,IP3 --list
    • 创建topic:./kafka-topics.sh --zookeeper IP1:2181,IP2,IP3 --create --topic t0425 --partition 3 --replication-factor 3
    • 控制台当做生产者:./kafka-console-producer.sh --broker-list IP1:9092,IP2:9092,IP3:9092 --topic t0425 
    • 控制台当做消费者:./kafka-console-consumer.sh --zookeeper IP1:2181,IP2:2181,IP3:2181 --topic t0425
    • 查看topic的描述信息:./kafka-topics.sh --ZooKeeper IP1,IP2,IP3 --describe --topic t0425
    • 查看producer生产消息的最大位置:./bin/kafka-run-class.sh kafka.tools.GetOffsetShell --broker-list IP1:9092 --topic t0425 --time -1
      • -1表示查询t0425各个分区当前最大的消息位移值(注意:这里的位移不是consumer端的位移,而是值消息在每个分区的位置 
    • 如果你要查询曾经生产过的最大消息数,那么只运行上面这条命令,然后把各个分区的结果相加就可以了
    • ​​​​​​​如果你需要查询当前集群中该topic的消息数,那么还需要运行下面这条命令:./bin/kafka-run-class.sh kafka.tools.GetOffsetShell --broker-list IP1:9092 --topic t0425 --time -2
      • ​​​​​​​-2表示去获取当前各个分区的最小位移,之后把运行第一条命令的结果与刚刚获取的位移之和相减就是集群中该topic的当前消息总数
  • ​​​​​​​​​​​​​​Kafka的Leader均衡机制
    • ​​​​​​​当partition的leader挂掉,会按照副本优先去寻找新的leader,由新的leader来管理partition
    • 当挂掉的leader重新启动,partition会重新由原来的leader管理
  • ​​​​​​​删除topic
    • ​​​​​​​第一步:先删除 kafka-logs 目录下的想要删除的topic:rm -rf kafka-logs/topic名-*
    • 第二步:delete删除想要删除的topic:./bin/kafka-topics.sh --zookeeper localhost:2181 --delete --topic topic名
    • 第三步:查看topic:./bin/kafka-topics.sh --zookeeper localhost:2181 --list
    • 第四步:想要立刻删除,还要删除ZooKeeper中的topic信息:rmr /brokers/topics/t0425
    • 第五步:删除被删除标记所标记的topic:rmr /admin/delete_topics/t0425
    • 第六步:再次查看就没有了
### Kafka中间件的功能特性 Kafka 是一种分布式流处理平台,具有高度的灵活性和可扩展性。它可以作为消息中间件使用,同时也支持日志收集和数据处理等功能[^1]。以下是 Kafka 的主要功能特性: - **高吞吐量**:Kafka 能够高效地处理大规模的数据流,适合用于大数据环境下的实时数据分析。 - **持久化存储**:通过将消息写入磁盘并提供复制机制,Kafka 提供了可靠的消息传递能力[^2]。 - **分区与并行处理**:Topic 可以划分为多个 Partition,从而实现消息的并行生产和消费,提升系统的整体性能。 - **灵活的消息格式**:Kafka 支持多种数据类型和格式,允许用户自定义消息结构和处理逻辑[^1]。 ### Kafka 中间件的核心组件 为了更好地理解 Kafka 的工作原理,下面列举其核心组成部分及其作用[^2]: - **Broker**:Kafka 集群中的节点,负责接收、存储以及分发消息。 - **Topic**:用来分类消息的主题名称,生产者向 Topic 发送消息,消费者从 Topic 订阅消息。 - **Producer**:负责创建消息并将它们发送至 Broker 的客户端程序。 - **Consumer**:从 Broker 获取消息并进行处理的客户端程序。 - **Partition**:物理上划分的一个 Topic 子集,每个 Partition 内部保持消息的顺序。 - **Consumer Group**:一组 Consumer 组成的集合,同一组内的 Consumer 不会重复消费同一条消息。 ### Kafka 的典型应用场景 由于 Kafka 具备高性能、高可用性和灵活的设计特点,因此广泛应用于以下领域[^3]: - **实时数据管道构建**:连接不同系统之间的数据流动,例如 ETL 工作流程。 - **网站活动跟踪**:记录用户的点击行为和其他交互动作以便后续分析。 - **度量指标监控**:采集服务器运行状态或其他业务层面的关键绩效指标(KPIs)。 - **在线推荐引擎**:依据用户偏好动态调整商品展示列表或广告投放策略。 尽管 RocketMQ 更加侧重于强一致性保障的任务调度场合比如金融支付环节等[^3],然而对于大多数互联网服务而言,Kafka 凭借着卓越的表现力已然成为首选方案之一。 ```python from kafka import KafkaProducer, KafkaConsumer producer = KafkaProducer(bootstrap_servers='localhost:9092') producer.send('my-topic', b'Hello, Kafka!') consumer = KafkaConsumer( 'my-topic', bootstrap_servers=['localhost:9092'], auto_offset_reset='earliest', enable_auto_commit=True, group_id='my-group') for message in consumer: print(f"{message.topic}:{message.partition}:{message.offset}: key={message.key} value={message.value}") ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值