Kafka基本架构

那一年_我九岁

已于 2024-10-20 17:26:27 修改

阅读量784

点赞数 6

分类专栏： kafka 文章标签： kafka 架构分布式

于 2024-04-22 13:11:27 首次发布

本文链接：https://blog.youkuaiyun.com/weixin_44852067/article/details/138072120

版权

kafka 专栏收录该内容

7 篇文章

订阅专栏

本文介绍了ApacheKafka，一个用于大数据实时处理的分布式事件流平台，其特点包括高吞吐量、可靠性、多种消息模式以及独特的Broker、Topic和Partition设计。重点讲解了点对点和发布/订阅模式，以及Kafka的基本架构组件如Producer、Consumer和ConsumerGroup。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1.Kafka概述

Kafka是一个分布式的基于发布/订阅模式的消息队列（Message Queue），主要应用于大数据实时处理领域。（传统使用）

Kafka是一个开源的分布式事件流平台（event streaming platform），被数千家公司用于高性能数据管道、流分析、数据集成和关键任务应用。

Apache Kakfa 官网:

Apache Kafka is an open-source distributed event streaming platform used by thousands of companies for high-performance data pipelines, streaming analytics, data integration, and mission-critical applications.

2.Kafka的特点

高吞吐量：单机每秒处理几十上百万的消息量。即使存储了许多TB的消息，它也保持稳定的性能。
高性能：单节点支持上千个客户端，并保证零停机和零数据丢失，异步化处理机制
持久化： 将消息持久化到磁盘。通过将数据持久化到硬盘以及replica(follower节点)防止数据丢失。顺序读，顺序写；利用Linux的页缓存。
零拷贝：减少了很多的拷贝技术，以及可以总体减少阻塞事件，提高吞吐量。
可靠性 ：Kafka是分布式，分区，复制和容错的。
分布式系统，易于向外扩展。 所有的Producer、Broker和Consumer都会有多个，均为分布式的。无需停机即可扩展机器。多个Producer、Consumer可能是不同的应用。
客户端状态维护:消息被处理的状态是在Consumer端维护，而不是由server端维护。当失败时能自动平衡。
支持online（在线）和offline（离线）的场景。
支持多种客户端语言。 Kafka支持 Java、.NET、PHP、Python等多种语言。