Kafka 入门介绍

最新推荐文章于 2026-01-01 18:09:51 发布

原创最新推荐文章于 2026-01-01 18:09:51 发布 · 1.7k 阅读

·

21

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#kafka #主题Topic #分区Partition #生产者Producer #消费者Consumer #副本Replication #消费者组Group

Kafka 专栏收录该内容

56 篇文章 ¥29.90 ¥99.00

订阅专栏

超级会员免费看

Apache Kafka 是一个分布式流处理平台，提供高吞吐量的消息发布和订阅功能，支持主题和日志持久化、分布式和容错。Kafka 作为消息系统和存储系统，适用于消息中间件、行为追踪、运营指标、日志收集和流处理等多种场景。其核心概念包括生产者、消费者、主题、分区和副本，保证了消息顺序和容错性。

目录

二. 使用场景

三. 分布式的流平台

四. Kafka 的基本术语

4.1. 主题和日志（Topic 和 Log）

4.2. 分布式（Distribution）

4.3. 异地数据同步技术（Geo-Replication）

4.4. 生产者（Producers）

4.5. 消费者（Consumers）

4.6. Kafka 的保证（Guarantees）

4.7. Kafka 作为一个消息系统

4.8. Kafka 作为一个存储系统

4.9. Kafka 的流处理

一. 前言

Kafka 最初由 Linkedin 公司开发，是一个分布式、支持分区的（Partition）、多副本的（Replica），基于 Zookeeper 协调的分布式消息系统，它的最大的特性就是可以实时的处理大量数据以满足各种需求场景，比如基于 Hadoop 的批处理系统、低延迟的实时系统、Storm/Spark 流式处理引擎，web/nginx 日志、访问日志，消息服务等等，用 scala 语言编写，Linkedin 于2010年贡献给了 Apache 基金会并成为顶级开源项目。

Kafka 实际上算作是分布式的流处理平台，具备消息中间件的功能，在大数据领域作为流计算的平台，也会做消息分发。

Kafka 具有高吞吐量、高横向扩容以及故障转移，支持幂等性、事务以及三种消息语义，并且具有消息持久化等特点。

二. 使用场景

下面是一些关于 Apache Kafka 非常流行的使用场景。这些领域的概述，可查看英文博客

了解本专栏

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

流华追梦 你的鼓励将是我创作最大的动力。

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。