kafka--1-基本概念

本文介绍了Kafka的基本概念,包括Broker、Topic、Partition及其作用。讲解了Kafka如何利用Partition实现大数据场景下的日志收集和处理,以及Kafka集群的配置和消息消费模式,包括单播和发布订阅模式。还提到了Kafka与Zookeeper的关系以及集群的无状态特性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

kafka 强依赖 zookeeper。

应用在大数据场景,例如大数据的日志收集。

Borker -- 每台机器上可以运行一个或多个kafka的进程--Broker。

Topic -- 代表一个业务上的数据集合。相当于对数据进行业务上逻辑上的区分。但是对于大数据中把Tb的数据在一个机器的,一个日志文件肯定会有容量上的限制。可以在topic内部划分多个partition来分片存储数据。

Partition -- 同一个topic的不同的partition可以为于不同的机器上。Partition是一个有序的Message序列,这些message按顺序添加到一个叫做commit log的文件中,每个partition中的消息都有一个唯一的编号,称之为offset,用来唯一表示每个分区的message。paration 相当于一个日志文件,可以把一个topic的日志问题件分成多个。发消息时候,可以制定往哪个topic哪个partition里面去发,如果不指定,就好轮巡的方式往各个partition里面发。

Partition 好处:

1. 一个commit log 文件会受到机器在文件系统中的大小限制,分区之后,理论上一个topic可以处理任意数量的的数据。

2. 提高类并行度。

kafka集群在配置时间范围内,维护所有由producer生成的信息。不用去管这些消息有没有被消费,例如日志保留log retention时间被设置为2天,kafka会维护最近2天所生产的所有消息,2天前的会被丢弃。每个consumer基于自己在commit log中的消费进度(offset)来进行工作。在kafka中,cosumer的offset由自己来维

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值