kafka是流文件处理平台中可以说是成功的,毕竟现在涉及的领域之大已经不得不让我们多少了解一点。kafka也算是我工作以来接触最多的一项技术了,截止目前也就刚能达到勉强能用的程度。kafka官方给出的定义是:kafka是一个分布式的流处理平台。有高吞吐、高容错、支持发布-订阅的特点。
kafka是个分布式的系统,所以这就决定了这个系统是强依赖zookeeper的,需要一个第三方的管理员来调用kafka的主机资源,消费者分配等。我认为kafka是一个简单的消息处理平台,通俗一点讲就是,往一个池子里注水,排水的过程。大致分为三部分,简单画一下:
这三部分都是可以由多个组成的,多profucer、多Brokers、多Consumers。Brokers是一般是一个>1的集群,由zookeeper进行管理调度,这里最主要的是leader的选举,follower的复制。consumer的话也由zookeeper进行协调对应topic的对应partition的,下面详细说一下:
生产者(Producer):这是数据的生产者,通过这部分操作把数据发送的kafka的主机上,就是向池子里注水,当然,注水口可以是1,可以为多;
Broker:相当于水池,它在这等着生产者不断的注水
白话kafka(一)
最新推荐文章于 2023-02-09 11:21:16 发布