Kafka Streams：流处理引擎深度解析

Kafka Streams流处理引擎深度解析

最新推荐文章于 2025-09-02 11:16:32 发布

原创

最新推荐文章于 2025-09-02 11:16:32 发布 · 891 阅读

23 ·

CC 4.0 BY-SA版权

文章标签：

#Kafka # Stream Processing # Data Engineering

📕我是廖志伟，一名Java开发工程师、《Java项目实战——深入理解大型互联网企业通用技术》（基础篇）、（进阶篇）、（架构篇）、《解密程序员的思维密码——沟通、演讲、思考的实践》作者、清华大学出版社签约作家、Java领域优质创作者、优快云博客专家、阿里云专家博主、51CTO专家博主、产品软文专业写手、技术文章评审老师、技术类问卷调查设计师、幕后大佬社区创始人、开源项目贡献者。

📘拥有多年一线研发和团队管理经验，研究过主流框架的底层源码(Spring、SpringBoot、SpringMVC、SpringCloud、Mybatis、Dubbo、Zookeeper)，消息中间件底层架构原理(RabbitMQ、RocketMQ、Kafka)、Redis缓存、MySQL关系型数据库、 ElasticSearch全文搜索、MongoDB非关系型数据库、Apache ShardingSphere分库分表读写分离、设计模式、领域驱动DDD、Kubernetes容器编排等。

📙不定期分享高并发、高可用、高性能、微服务、分布式、海量数据、性能调优、云原生、项目管理、产品思维、技术选型、架构设计、求职面试、副业思维、个人成长等内容。

Java程序员廖志伟

💡在这个美好的时刻，笔者不再啰嗦废话，现在毫不拖延地进入文章所要讨论的主题。接下来，我将为大家呈现正文内容。

优快云

🍊 Kafka知识点之Streams处理引擎：概述

在当今大数据时代，实时数据处理的需求日益增长，尤其是在金融、电商、物联网等领域，对数据的实时处理和分析能力提出了极高的要求。在这样的背景下，如何高效、稳定地处理海量数据流成为一个关键问题。Kafka作为一款流行的分布式流处理平台，其Streams处理引擎正是为了解决这一难题而设计的。下面，我们将通过一个具体场景来引出对Kafka知识点之Streams处理引擎的介绍。

想象一下，一个在线交易系统需要实时处理数百万笔交易数据，并对这些数据进行实时分析和决策。如果使用传统的数据处理方式，如批处理或单线程处理，将无法满足实时性要求，且系统性能和可扩展性也将受到限制。这时，Kafka的Streams处理引擎就派上了用场。

Kafka的Streams处理引擎是一个强大的流处理框架，它允许开发者构建实时数据应用，能够高效地处理和分析数据流。介绍这一知识点的重要性在于，它能够帮助开发者理解和掌握如何利用Kafka处理实时数据，从而提高系统的响应速度和数据处理能力。

接下来，我们将对Kafka知识点之Streams处理引擎进行深入探讨。首先，我们将介绍其概念，阐述Streams处理引擎的基本原理和运作方式。然后，我们会详细分析Streams处理引擎的特点，包括其高吞吐量、低延迟、容错性等优势。最后，我们将探讨Streams处理引擎的应用场景，展示其在不同业务场景下的实际应用效果。

具体来说，我们将依次介绍以下内容：

Kafka知识点之Streams处理引擎：概念，我们将解释Streams处理引擎是如何工作的，以及它如何与Kafka的分布式特性相结合。
Kafka知识点之Streams处理引擎：特点，我们将分析Streams处理引擎的优势，如高效的数据处理能力、灵活的流处理操作等。
Kafka知识点之Streams处理引擎：应用场景，我们将通过实际案例展示Streams处理引擎在各个领域的应用，如实时分析、事件驱动架构等。

Kafka Streams处理引擎：概念

🎉 Kafka Streams架构

Kafka Streams是一个基于Kafka的流处理框架，它允许用户以声明式的方式处理实时数据流。Kafka Streams的架构设计旨在提供高性能、可伸缩和容错的处理能力。其核心组件包括：

Kafka Streams API：提供声明式编程接口，用于构建流处理应用程序。
Kafka Streams Runtime：负责执行流处理应用程序，包括数据流的读取、处理和输出。

🎉 Streams API核心概念

Streams API的核心概念包括：

Streams：表示数据流，是数据处理的起点。
Streams Operations：包括连接操作、聚合操作等，用于对数据进行处理。
State Stores：用于存储状态信息，如窗口状态、聚合状态等。

🎉 状态管理和容错机制

Kafka Streams提供了强大的状态管理和容错机制：

状态管理：通过State Stores来存储和管理状态信息，确保数据的准确性和一致性。
容错机制：通过Kafka的副本机制和事务日志来保证数据的持久性和可靠性。

🎉 时间窗口和事件时间处理

Kafka Streams支持时间窗口和事件时间处理：

时间窗口：将数据按照时间间隔进行分组，如每5分钟一个窗口。
事件时间处理：根据事件发生的时间进行数据处理，不受数据到达时间的影响。

🎉 连接操作和聚合操作

连接操作和聚合操作是Streams API中的两个重要操作：

连接操作：将两个或多个数据流连接起来，进行联合处理。
聚合操作：对数据进行聚合，如求和、计数等。

🎉 实时数据处理流程

Kafka Streams的实时数据处理流程如下：

从Kafka主题读取数据流。
使用Streams API对数据进行处理。
将处理后的数据输出到Kafka主题或其他系统。

🎉 与Kafka集群的集成

Kafka Streams与Kafka集群紧密集成，支持：

数据源：从Kafka主题读取数据。
数据输出：将处理后的数据输出到Kafka主题。

🎉 性能优化和资源管理

Kafka Streams提供了多种性能优化和资源管理策略：

并行处理：支持并行处理，提高处理速度。
资源管理：根据需求动态调整资源分配。

🎉 实际应用案例和最佳实践

以下是一些实际应用案例和最佳实践：

案例1：使用Kafka Streams构建实时推荐系统，根据用户行为进行个性化推荐。
最佳实践1：合理设计数据流和处理逻辑，提高处理速度和资源利用率。

通过以上内容，我们可以了解到Kafka Streams处理引擎的概念、架构、核心概念、状态管理和容错机制、时间窗口和事件时间处理、连接操作和聚合操作、实时数据处理流程、与Kafka集群的集成、性能优化和资源管理，以及实际应用案例和最佳实践。希望这些内容能帮助您更好地理解和应用Kafka Streams处理引擎。

Kafka知识点之Streams处理引擎：特点

实时数据处理能力 Kafka Streams处理引擎具备强大的实时数据处理能力，能够实时处理大量数据流。它通过Kafka的分布式特性，可以处理来自多个数据源的数据，并实时输出处理结果。这种能力使得Streams处理引擎在实时分析、监控和决策支持等领域有着广泛的应用。

高吞吐量 Streams处理引擎支持高吞吐量的数据处理。它通过并行处理数据，能够快速处理大量数据，满足实时性要求。在处理大规模数据流时，Streams处理引擎能够保持高性能，确保数据处理的实时性和准确性。

可扩展性 Streams处理引擎具有良好的可扩展性。它支持水平扩展，可以通过增加更多的节点来提高处理能力。此外，Streams处理引擎还支持动态调整资源分配，以适应不同的业务需求。

灵活的数据处理模式 Streams处理引擎支持多种数据处理模式，包括过滤、转换、聚合等。这些模式可以灵活组合，满足不同的数据处理需求。例如，可以使用过滤模式筛选特定数据，使用转换模式对数据进行格式转换，使用聚合模式对数据进行统计汇总。

易于与其他系统集成 Streams处理引擎易于与其他系统集成。它可以通过Kafka Connect插件与其他数据源和系统进行数据交换。此外，Streams处理引擎还支持与外部系统进行交互，如通过HTTP API接收请求或发送通知。

简单易用的API Streams处理引擎提供了简单易用的API，使得开发者可以轻松地构建数据处理应用。API设计遵循Java Stream API的风格，使得开发者可以方便地使用熟悉的编程范式进行数据处理。

支持多种数据源和输出目标 Streams处理引擎支持多种数据源和输出目标。数据源包括Kafka主题、外部数据库、文件系统等；输出目标包括Kafka主题、外部数据库、文件系统等。这种灵活性使得Streams处理引擎可以适应不同的数据场景。

高效的容错机制 Streams处理引擎具备高效的容错机制。它通过Kafka的副本机制，确保数据在处理过程中的可靠性和一致性。在发生故障时，Streams处理引擎可以自动从副本中恢复数据，保证数据处理过程的连续性。

支持多种数据格式 Streams处理引擎支持多种数据格式，包括JSON、Avro、Protobuf等。这种灵活性使得Streams处理引擎可以处理不同格式的数据，满足多样化的数据处理需求。

支持多种窗口操作 Streams处理引擎支持多种窗口操作，如时间窗口、滑动窗口等。这些窗口操作可以用于对数据进行时间序列分析，如计算过去一段时间内的数据统计指标。

支持复杂事件处理 Streams处理引擎支持复杂事件处理，如事件序列、事件模式匹配等。这些功能使得Streams处理引擎可以处理复杂的数据场景，如实时监控、异常检测等。

支持多种状态管理策略 Streams处理引擎支持多种状态管理策略，如持久化状态、非持久化状态等。这些策略可以根据不同的业务需求进行选择，以优化数据处理性能和资源利用。

Kafka知识点之Streams处理引擎：应用场景

Kafka Streams是Apache Kafka的一个流处理库，它允许用户以声明式的方式处理Kafka中的数据流。下面，我们将从多个维度深入探讨Kafka Streams的应用场景。

🎉 Kafka Streams核心概念

Kafka Streams的核心概念包括：

Streams API：提供了一种声明式的方式来定义数据流的处理逻辑。
状态存储：允许将数据流中的数据持久化，以便进行复杂的数据处理。
窗口操作：允许对数据流进行时间窗口或计数窗口操作。

🎉 数据流处理模型

Kafka Streams支持多种数据流处理模型，包括：

无状态流处理：处理不依赖于历史数据的流。
有状态流处理：处理依赖于历史数据的流。
窗口流处理：对数据流进行时间窗口或计数窗口操作。

🎉 实时数据处理能力

Kafka Streams能够处理实时数据，这使得它非常适合以下场景：

实时事件处理：例如，实时用户行为分析。
实时监控：例如，实时系统性能监控。

🎉 高吞吐量与低延迟

Kafka Streams具有高吞吐量和低延迟的特点，这使得它非常适合以下场景：

实时推荐系统：例如，基于用户行为的实时推荐。
实时广告系统：例如，实时广告投放。

🎉 水平扩展与容错性

Kafka Streams支持水平扩展和容错性，这使得它非常适合以下场景：

大规模数据处理：例如，处理来自多个源的数据。
高可用性系统：例如，构建高可用性的实时系统。

🎉 应用场景分析

📝 实时数据聚合

Kafka Streams可以用于实时数据聚合，例如，实时计算用户点击次数、实时计算订单数量等。

📝 实时数据转换

Kafka Streams可以用于实时数据转换，例如，将原始数据转换为结构化数据，以便进行进一步处理。

📝 实时数据监控

Kafka Streams可以用于实时数据监控，例如，实时监控系统性能指标。

📝 实时数据流分析

Kafka Streams可以用于实时数据流分析，例如，实时分析用户行为数据。

📝 与其他大数据技术集成

Kafka Streams可以与其他大数据技术集成，例如，与Hadoop、Spark等集成，实现更复杂的数据处理。

📝 实时数据仓库构建

Kafka Streams可以用于构建实时数据仓库，例如，实时构建用户行为数据仓库。

📝 实时推荐系统

Kafka Streams可以用于构建实时推荐系统，例如，基于用户行为的实时推荐。

📝 实时广告系统

Kafka Streams可以用于构建实时广告系统，例如，实时广告投放。

📝 实时风控系统

Kafka Streams可以用于构建实时风控系统，例如，实时监控交易风险。

📝 实时日志处理

Kafka Streams可以用于实时日志处理，例如，实时分析日志数据。

📝 实时数据同步

Kafka Streams可以用于实时数据同步，例如，实时同步数据库数据。

📝 实时数据清洗与转换

Kafka Streams可以用于实时数据清洗与转换，例如，实时清洗和转换日志数据。

📝 实时数据可视化

Kafka Streams可以用于实时数据可视化，例如，实时展示系统性能指标。

通过以上分析，我们可以看到Kafka Streams在实时数据处理领域具有广泛的应用场景。它的高吞吐量、低延迟、水平扩展和容错性等特点，使得它成为构建实时系统的理想选择。

🍊 Kafka知识点之Streams处理引擎：架构

在当今大数据时代，实时数据处理的需求日益增长，尤其是在金融、电商、物联网等领域。想象一下，一个在线交易系统需要实时处理数百万笔交易数据，并实时生成交易报告。如果使用传统的数据处理方式，如批处理，将无法满足这种实时性要求。这时，Kafka Streams处理引擎应运而生，它能够帮助我们高效地处理这些实时数据流。

Kafka Streams处理引擎是Apache Kafka的一个高级客户端库，它允许开发者以声明式的方式处理Kafka中的数据流。在上述场景中，如果没有Kafka Streams处理引擎，我们可能需要手动编写复杂的代码来处理数据流，这不仅效率低下，而且容易出错。因此，介绍Kafka知识点之Streams处理引擎：架构，对于理解其如何高效、稳定地处理数据流至关重要。

Kafka Streams处理引擎的架构设计是其高效性和可扩展性的关键。接下来，我们将深入探讨以下几个方面的内容：

核心组件：我们将详细介绍Kafka Streams处理引擎的核心组件，包括Streams应用、Streams拓扑、Streams任务等，以及它们如何协同工作以处理数据流。
Streams API：我们将介绍Kafka Streams提供的API，这些API允许开发者以声明式的方式定义数据处理逻辑，从而简化了数据流的处理过程。
Streams State Store：我们将探讨Streams State Store的作用，它为Streams应用提供了持久化状态存储，使得状态恢复和容错成为可能。
Streams Configurations：我们将讨论如何配置Kafka Streams应用，包括设置流处理参数、连接到Kafka集群等。
数据流处理流程：我们将概述Kafka Streams处理数据流的整个流程，从数据输入到输出，帮助读者理解数据是如何被处理和转换的。

通过这些内容的介绍，读者将能够全面理解Kafka Streams处理引擎的架构，并能够根据实际需求设计和实现高效的数据流处理应用。

🎉 Streams API 简介

Kafka Streams 是一个基于 Java 的高性能、可伸缩的流处理库，它允许用户以声明式的方式处理 Kafka 中的数据流。Streams API 是 Kafka 提供的一个高级抽象，它允许开发者以类似于 SQL 的方式处理数据流，这使得开发者可以轻松地构建复杂的数据处理应用。

🎉 数据流处理模型

Kafka Streams 使用拉模型（Pull Model）来处理数据流。在这种模型中，每个处理节点（Processor）从 Kafka 主题中拉取数据，进行处理，然后将结果输出到另一个 Kafka 主题或进行其他操作。

🎉 核心组件架构

Kafka Streams 的核心组件包括：

Processor API：用于定义数据处理逻辑。
State Store：用于存储处理过程中的状态信息。
Windowing：用于处理时间窗口内的数据。
Connectors：用于将 Kafka Streams 应用与外部系统集成。

🎉 数据源与处理器

数据源是 Kafka Streams 应用的输入，可以是 Kafka 主题、文件或其他数据源。处理器是 Kafka Streams 应用的核心，它负责读取数据源的数据，进行处理，并将结果输出到其他数据源或输出流。

🎉 窗口与时间语义

窗口是 Kafka Streams 中用于处理时间序列数据的一种机制。窗口可以将时间序列数据划分为不同的时间段，以便于进行聚合、计数等操作。时间语义定义了窗口的触发条件和触发方式。

🎉 状态管理与容错机制

Kafka Streams 提供了状态管理功能，允许用户存储和处理状态信息。此外，它还提供了容错机制，确保在发生故障时能够恢复数据。

🎉 连接器与外部系统集成

Kafka Streams 支持多种连接器，可以方便地将 Kafka Streams 应用与外部系统集成。例如，可以将 Kafka Streams 应用与 HDFS、Elasticsearch 等外部系统集成。

🎉 性能优化与调优

为了提高 Kafka Streams 应用的性能，可以采取以下措施：

合理配置窗口大小：窗口大小应与业务需求相匹配，避免过小或过大的窗口。
优化状态存储：合理配置状态存储的参数，如分区数、副本数等。
调整 JVM 参数：根据应用需求调整 JVM 参数，如堆内存大小、垃圾回收策略等。

🎉 实际应用案例

以下是一个简单的 Kafka Streams 应用案例，用于计算 Kafka 主题中单词出现的频率：

import org.apache.kafka.streams.KafkaStreams;
import org.apache.kafka.streams.StreamsBuilder;
import org.apache.kafka.streams.StreamsConfig;
import org.apache.kafka.streams.kstream.KStream;
import org.apache.kafka.streams.kstream.KTable;

public class WordCountExample {
    public static void main(String[] args) {
        StreamsBuilder builder = new StreamsBuilder();
        KStream<String, String> textLines = builder.stream("input-topic");
        KTable<String, Long> wordCounts = textLines
            .flatMapValues(value -> Arrays.asList(value.toLowerCase().split("\\W+")))
            .groupBy((key, word) -> word)
            .count();

        wordCounts.to("output-topic");
        KafkaStreams streams = new KafkaStreams(builder.build(), new StreamsConfig());
        streams.start();
        // Add shutdown hook to respond to SIGTERM and gracefully close Kafka Streams
        Runtime.getRuntime().addShutdownHook(new Thread(streams::close));
    }
}

🎉 与其他Kafka组件的关系

Kafka Streams 是 Kafka 生态系统的一部分，与其他组件如 Kafka Connect、Kafka Streams API 等紧密集成。例如，Kafka Streams 可以与 Kafka Connect 集成，实现数据流的导入和导出。同时，Kafka Streams API 可以与 Kafka Streams 应用集成，提供更高级的数据处理功能。

🎉 Kafka Streams API：数据处理流程解析

Kafka Streams API 是 Kafka 官方提供的一个用于构建实时流处理应用的库。它允许开发者使用 Java 或 Scala 语言，以声明式的方式处理 Kafka 中的数据流。下面，我们将从多个维度深入解析 Kafka Streams API 的数据处理流程。

📝 数据处理流程

Kafka Streams API 的数据处理流程可以概括为以下几个步骤：

数据输入：从 Kafka 主题中读取数据。
数据处理：对数据进行转换、过滤、聚合等操作。
数据输出：将处理后的数据写入 Kafka 主题或其他系统。

以下是一个简化的数据处理流程表格：

步骤	描述	示例
数据输入	从 Kafka 主题中读取数据	`KStream<String, String> stream = builder.stream("input-topic");`
数据处理	对数据进行转换、过滤、聚合等操作	`KStream<String, String> processedStream = stream.filter((key, value) -> value.contains("Java"));`
数据输出	将处理后的数据写入 Kafka 主题或其他系统	`processedStream.to("output-topic");`

📝 状态管理

Kafka Streams API 提供了状态管理功能，允许开发者将数据持久化到磁盘，以便在系统重启后恢复。状态管理的关键是 KTable，它是一个键值对集合，可以存储在内存中或持久化到磁盘。

以下是一个状态管理的示例代码：

KTable<String, String> table = builder.table("input-topic", "output-topic");
table.toStream().filter((key, value) -> value.contains("Java")).to("output-topic");

📝 窗口操作

窗口操作是 Kafka Streams API 中处理时间序列数据的重要功能。它可以将数据分组到不同的窗口中，例如按时间、计数或滑动窗口。

以下是一个窗口操作的示例代码：

KTable<String, Long> countTable = stream
    .groupByKey()
    .windowedBy(TimeWindows.of(Duration.ofMinutes(1)))
    .count();

📝 连接器

连接器允许 Kafka Streams API 与外部系统集成。例如，可以将处理后的数据写入外部数据库或触发外部作业。

以下是一个连接器的示例代码：

stream.to("output-topic");

📝 容错机制

Kafka Streams API 提供了容错机制，确保在系统故障时数据不会丢失。它通过将状态持久化到磁盘，并在系统重启后恢复状态来实现。

📝 性能调优

性能调优是提高 Kafka Streams API 应用性能的关键。以下是一些性能调优的建议：

使用合适的窗口大小和滑动窗口。
优化状态存储和持久化策略。
调整并行度。

📝 监控与日志

Kafka Streams API 提供了监控和日志功能，帮助开发者了解应用的状态和性能。

📝 与外部系统集成

Kafka Streams API 可以与各种外部系统集成，例如数据库、消息队列和外部存储。

📝 应用案例

以下是一些 Kafka Streams API 的应用案例：

实时数据聚合：对 Kafka 主题中的数据进行实时聚合，例如计算每小时的点击量。
实时推荐系统：根据用户行为数据生成实时推荐。
实时监控：监控 Kafka 主题中的数据，例如检测异常数据。

通过以上解析，我们可以看到 Kafka Streams API 在数据处理流程、状态管理、窗口操作、连接器、容错机制、性能调优、监控与日志、与外部系统集成以及应用案例等方面都具有强大的功能。这些功能使得 Kafka Streams API 成为构建实时流处理应用的首选工具。

Kafka知识点之Streams处理引擎：Streams State Store

🎉 Streams处理引擎概述

Kafka Streams是Apache Kafka的一个流处理库，它允许用户以声明式的方式处理Kafka中的数据流。Streams处理引擎的核心是能够处理无界和有界的数据流，并且能够将流处理逻辑封装成可重用的组件。

🎉 State Store概念与作用

State Store是Kafka Streams处理引擎中的一个关键概念，它用于存储流处理过程中的状态信息。State Store的作用是持久化状态数据，以便在系统重启后能够恢复状态，同时它还支持状态数据的快速访问，从而提高处理效率。

🎉 常见State Store类型

类型	描述	适用场景
In-Memory	存储在内存中，速度快，但重启后数据丢失	需要快速访问状态数据，且对数据持久性要求不高的场景
RocksDB	使用RocksDB作为存储后端，支持持久化	需要持久化状态数据，且对性能要求较高的场景
Kafka	使用Kafka作为存储后端，支持分布式存储	需要分布式存储状态数据，且对数据持久性要求较高的场景

🎉 State Store配置与优化

配置State Store时，需要考虑以下因素：

选择合适的存储后端
设置合适的缓存大小
调整垃圾回收策略

优化State Store的方法包括：

使用合适的分区策略
调整负载均衡策略
使用压缩技术减少存储空间

🎉 State Store与Kafka Streams的关系

State Store是Kafka Streams处理引擎的一部分，它为Streams处理引擎提供状态存储功能。Streams处理引擎通过State Store来持久化状态数据，以便在系统重启后能够恢复状态。

🎉 State Store的持久化与恢复

State Store的持久化可以通过以下方式实现：

定期将状态数据写入磁盘
使用Kafka作为存储后端，利用Kafka的持久化特性

State Store的恢复可以通过以下方式实现：

在系统启动时从磁盘读取状态数据
从Kafka中读取状态数据

🎉 State Store的并发控制与一致性

State Store支持并发访问，需要实现并发控制机制来保证数据的一致性。常见的并发控制机制包括：

乐观锁
悲观锁

🎉 State Store的性能影响与调优

State Store的性能对Kafka Streams处理引擎的整体性能有重要影响。以下是一些性能调优方法：

选择合适的存储后端
调整缓存大小
使用压缩技术

🎉 State Store的故障处理与排查

State Store可能出现的故障包括：

数据损坏
存储后端故障

故障排查方法包括：

检查日志
使用工具进行性能分析
恢复数据

🎉 State Store的实际应用案例

以下是一个使用Kafka Streams处理引擎和State Store的实际应用案例：

graph LR
A[输入数据] --> B{Kafka Streams处理引擎}
B --> C{State Store}
C --> D[输出数据]

在这个案例中，输入数据通过Kafka Streams处理引擎进行处理，并将状态数据存储在State Store中。处理完成后，输出数据被发送到目标系统。通过使用State Store，即使在系统重启后，也能够恢复状态数据，保证处理过程的连续性。

🎉 Streams API 简介

Kafka Streams 是 Kafka 官方提供的一个流处理库，它允许用户以声明式的方式处理 Kafka 中的数据流。Streams API 允许开发者将 Kafka 中的数据流作为输入，通过定义一系列的转换和操作，最终输出到 Kafka 或其他系统。这种处理方式使得数据流处理变得简单且高效。

🎉 配置文件概述

Kafka Streams 的配置通常通过一个配置文件来管理，这个文件通常是一个 Java 配置文件（.properties）格式。配置文件中包含了 Streams 处理引擎的各种配置参数，这些参数决定了处理引擎的行为和性能。

🎉 常用配置参数

配置参数	描述	示例
application.id	Streams 应用程序的唯一标识符	application.id=my-streams-app
bootstrap.servers	Kafka 集群的连接地址	bootstrap.servers=kafka1:9092,kafka2:9092
state.dir	状态存储的目录	state.dir=/tmp/kafka-streams-state