初识kafka小结

第一部分:概述

    1.1 Kafka的定义:

      kafka是一个分布式的基于发布/订阅模式消息队列(Message Queue),主要应用于大数据实时处理领域。

    1.2消息队列

     1.2.1传统消息队列的应用场景

    使用消息队列的好处

    1)  解耦

        允许你独立的扩展或修改两边的处理过程,只要确保他们遵守同样的接口约束。(不需要两边同时在线,把消息放到消息队列里,什么时候想取就什么时候取)

    2)  可恢复性

        系统的一部分组件失效时,不会影响到整个系统。消息队列降低了进程间的耦合度,所以即使一个处理消息的进程挂掉,加入消息队列中的消息仍然可以在系统恢复后被处理。(跟解耦一样,一部分组件出问题了消息就会放到消息队列里,等恢复了在从消息队列里把消息取出来)

    3)缓冲

        有助于控制和优化数据流经过系统的速度,解决生产消息和消费消息的处理速度不一致的情况。(当生产的数据大于一部分组件的消费能力,把大于这些组件消费能力的数据放入到消息队列里,慢慢消费)

    4)灵活性 & 峰值处理能力 

        在访问量剧增的情况下,应用仍然需要继续发挥作用,但是这样的突发流量并不常见。如果为以能处理这类峰值访问为标准投入资源随时待命无疑是巨大的浪费。使用消息队列能够使关键组件顶住突发的访问压力,而不会因为突发的超负荷的请求而完全崩溃。(可以动态的增加减少)

    5)异步通讯

         很多时候,用户不想也不需要立即处理消息。消息队列提供了异步处理机制,允许用户把一个消息放入队列,但并不立刻处理它。想向队列种放入多少消息就放多少,然后在需要的时候再去处理它们。

  1.2.2消息队列的两种模式

        (1) 点对点模式一对一,消费者主动拉取数据,消息收到后消息清除)                                                                                            消息生产者生产消息发送到Queue中,然后消息消费者从Queue中取出并且消费消息。 消息被消费以后,queue 中不再有存储,所以消息消费者不可能消费到已经被消费的消息。 Queue 支持存在多个消费者,但是对一个消息而言,只会有一个消费者可以消费。

        (2) 发布/订阅模式(一对多,消费者消费数据之后不会清除消息)                                                                                                      消息生产者(发布)将消息发布到 topic 中,同时有多个消息消费者(订阅)消费该消 息。和点对点方式不同,发布到 topic 的消息会被所有订阅者消费。

  1.3 Kafka 基础框架

 

    1Producer 消息生产者,就是向 kafka broker 发消息的客户端;
    2Consumer 消息消费者,向 kafka broker 取消息的客户端;
    3Consumer Group CG):消费者组,由多个 consumer 组成。消费者组内每个消费者负 责消费不同分区的数据,个分区只能由个组内消费者消费;消费者组之间互不影响。所 有的消费者都属于某个消费者组,即消费者组是逻辑上的个订阅者
    4Broker 一台 kafka 服务器就是一个 broker。一个集群由多个 broker 组成。一个 broker 可以容纳多个 topic
    5Topic 可以理解为一个队列,生产者和消费者面向的都是topic
    6Partition为了实现扩展性,一个非常大的 topic 可以分布到多个 broker(即服务器)上, topic 可以分为多个partition,每个 partition 是一个有序的队列;
    7Replica副本,为保证集群中的某个节点发生故障时,该节点上的 partition 数据不丢失,
kafka 仍然能够继续工作,kafka 提供了副本机制,一个 topic 的每个分区都有若干个副本, 一个 leader 和若干个 follower
    8leader每个分区多个副本的“主”,生产者发送数据的对象,以及消费者消费数据的对 象都是 leader
    9follower每个分区多个副本中的“从”,实时从 leader 中同步数据,保持和 leader 数据
的同步。leader 发生故障时,某个 follower 会成为新的 follower

 

Kafka是一种高性能、分布式的流处理平台,广泛应用于实时数据处理和息传递场景。它提供了高吞吐量、低延迟的数据传输,并具备良好的可扩展性和容错性,还提供了一种高效、可靠的方式来发布和订阅息,其息存储机制是核心特性之一[^1][^2]。 为了便于理解Kafka的作用,可通过一个例子说明:在生产者和消费者的关系中,生产者生产鸡蛋,消费者消费鸡蛋。若消费者系统宕机,生产者继续生产,新生产的鸡蛋会丢失;若生产者生产速度远超消费者消费速度,会造成息堵塞,最终导致系统超时,“鸡蛋”也会丢失。此时,在它们中间放置一个“篮子”,生产的鸡蛋都放入篮子,消费者从篮子里拿鸡蛋,这样鸡蛋就不会丢失,这个“篮子”就是Kafka。这里的“鸡蛋”代表“数据流”,系统间通过“数据流”传输,也称为报文或“息”。当息队列满了,即“篮子”满了,可通过增加“篮子”数量实现Kafka的扩容[^3]。 以下是一个简单的Kafka生产者示例代码(使用Python和`kafka-python`库): ```python from kafka import KafkaProducer # 创建一个Kafka生产者实例 producer = KafkaProducer(bootstrap_servers='localhost:9092') # 发送息到指定的主题 topic = 'test_topic' message = b'Hello, Kafka!' producer.send(topic, message) # 确保所有息都被发送 producer.flush() # 关闭生产者连接 producer.close() ``` 以下是一个简单的Kafka消费者示例代码: ```python from kafka import KafkaConsumer # 创建一个Kafka消费者实例 consumer = KafkaConsumer( 'test_topic', bootstrap_servers='localhost:9092', auto_offset_reset='earliest' ) # 消费息 for message in consumer: print(f"Received message: {message.value.decode('utf-8')}") ```
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值