Kafka的入门及简单使用

最新推荐文章于 2025-04-11 07:14:55 发布

Yoel.qin

最新推荐文章于 2025-04-11 07:14:55 发布

阅读量1k

点赞数 41

分类专栏：消息队列文章标签： kafka 分布式

本文链接：https://blog.youkuaiyun.com/qq_43302441/article/details/140774537

版权

文章目录

前言
一、Kafka 的基本架构？
二、代码测试

前言

Kafka是由Apache软件基金会开发的一个开源流处理平台，由Scala和Java编写。该项目的目标是为处理实时数据提供一个统一、高吞吐、低延迟的平台。其持久化层本质上是一个“按照分布式事务日志架构的大规模发布/订阅消息队列”，这使它作为企业级基础设施来处理流式数据非常有价值。

Kafka 的核心特性可以总结为以下几个方面：

发布订阅模型：
- Kafka 使用类似于消息队列的发布订阅模型，但更侧重于消息持久化以及支持多消费者模型。
- 生产者（Producer）将消息发送到主题（Topic），消费者（Consumer）则订阅这些主题来消费消息。
- 消费者可以是多个消费者组成的消费者组（Consumer Group），这样可以实现消息的并行处理。
可扩展性：
- Kafka 能够水平扩展，通过增加更多的服务器节点可以提升系统的吞吐量。
- Kafka 可以部署在分布式集群中，具有很强的容错能力。
持久性和可靠性：
- Kafka 将消息存储在磁盘上，并允许复制到多个服务器上以防止数据丢失。
- Kafka 保证消息的顺序性，在一个分区内的消息会按照它们被发送的顺序存储和读取。
高性能：
- Kafka 设计为支持高吞吐量，即使在非常大的数据集上也能保持低延迟。
- Kafka 利用零拷贝技术来提高性能，这意味着它可以在不复制数据的情况下直接从磁盘读取数据到网络栈。
存储：
- Kafka 的数据存储是基于日志文件的，这意味着它可以有效地存储大量数据。
- Kafka 支持数据保留策略，可以根据时间和大小来决定何时删除旧数据。
流处理：
- Kafka Streams API 允许开发者创建复杂的流处理应用程序，如实时聚合、过滤和转换数据等操作。
- Kafka 还与其他流处理框架（如 Apache Flink 和 Apache Spark Streaming）集成良好。