kafka编程基础—入门介绍(一)

本文介绍了Kafka的关键能力,包括发布订阅消息、容错存储和实时处理。核心概念包括topic、log、producer和consumer。Kafka的分布式特性、数据同步技术和安全保障也得到阐述。此外,讨论了Kafka的顺序保证,使其在处理流数据时能同时兼顾顺序性和并行性。最后,Kafka的存储系统和流处理能力使其成为实时流处理平台的关键组件。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

关键能力

一个流处理平台具有三个关键能力:

  1. 发布和订阅消息(流),在这方面,它类似于一个消息队列或企业消息系统;
  2. 以容错(故障转移)的方式存储消息(流);
  3. 在消息流发生时处理它们。
有何优势
  1. 构建实时的流数据管道,可靠地获取系统和应用程序之间的数据。
  2. 构建实时流的应用程序,对数据流进行转换或反应。
核心概念

要了解kafka是如何做这些事情的,可以从下到上深入探讨kafka的能力。首先几个概念:

  1. kafka作为一个集群运行在一个或多个服务器上;
  2. kafka集群存储的消息是以topic为类别记录的;
  3. 每个消息(也叫记录record,我习惯叫消息)是由一个key,一个value和时间戳构成。

kafka有四个核心API:

  1. 应用程序使用 Producer API 发布消息到1个或多个topic(主题)中。
  2. 应用程序使用 Consumer API来订阅一个或多个topic,并处理产生的消息。
  3. 应用程序使用 Streams API充当一个流处理器,从1个或多个topic消费输入流,并生产一个输出流到1个或多个输出topic,有效地将输入流转换到输出流。
  4. Connector API可构建或运行可重用的生产者或消费者,将topic连接到现有的应用程序或数据系统。例如,连接到关系数据库的连接器可以捕获表的每个变更。

在这里插入图片描述
Client和Server之间的通讯,是通过一条简单、高性能并且和开发语言无关的TCP协议。并且该协议保持与老版本的兼容。Kafka提供了Java Client(客户端)。除了Java客户端外,还有非常多的其它编程语言的客户端。

首先来了解一下Kafka所使用的基本术语:

  1. Topic:Kafka将消息分门别类,每一类的消息称之为一个主题(Topic);
  2. Producer:发布消息的对象称之为主题生产者(Kafka topic producer);
  3. Consumer:订阅消息并处理发布的消息的对象称之为主题消费者(consumers)
  4. Broker:已发
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值