目录 一、核心概念与设计二、运维与部署三、监控与巡检四、性能优化与调优五、故障排查六、安全与权限七、工具与生态八、学习路径 Kafka深入学习及运维工作笔记 一、核心概念与设计 基础知识 Kafka 知识体系梳理Kafka 的主要特点及技术机制详解为何选择 Kafka?——Kafka 的核心优势与设计价值RabbitMQ、RocketMQ、Kafka 对比表格 消息传递机制 Kafka 消息投递语义及开发者控制机制详解 架构解析 Kafka 集群的高可用性Kafka 日志段(log segment)Kafka 的内存缓冲区 二、运维与部署 部署实践 Kafka部署使用Kafka 3.2.3内置的ZookeeperStrimzi Kafka Operator 配置管理 Kafka 的配置文件Kafka 关键参数的解释和作用Kafka 参数的整理说明适用于生产环境的 Kafka 参数配置模板 分区与副本 Kafka修改分区和副本数量Kafka:在线副本数 主题操作 Kafka 主题的分布情况Kafka文件目录介绍 三、监控与巡检 巡检框架 Kafka 巡检脚本框架Kafka 多实例 + 多节点 + Prometheus 集成的完整巡检脚本/体系框架 监控指标 Kafka 当前连接数 和 文件描述符使用率 的 Bash 脚本Kafka Listener 连接数kafka_exporter_run.sh脚本解读 日志分析 Kafka集群的日志分析-min.insync.replicas 四、性能优化与调优 JVM 管理 Kafka 的 JVM 到底是什么东西?Kafka 的 JVM 配置依据是什么?Kafka JVM 内存使用率告警信息分析与优化建议 性能测试 Kafka性能测试 存储优化 Kafka 的异步刷盘机制Kafka Topic 的大小 五、故障排查 资源限制 Kafka:java.io.IOException: Too many open filesKafka error sending message: Failed to allocate memory within the configured max blocking time 60000 消息阻塞 Kafka error sending message: Expiring 172 record(s) for [topic_name]: 120000 ms has passed sinceKafka 数据写入问题 六、安全与权限 鉴权配置 Kafka集群以开启客户端鉴权Kafka的权限配置中,匹配模式/opt/kafka/bin/kafka-configs.sh --bootstrap-server 配额管理 Kafka配额 七、工具与生态 客户端工具 kcat - Apache Kafka producer and consumer toolKafka如何查看topic的数据 数据集成 Kafka ConnectFilebeat、Logstash和Fluentbit – Kafkaconfluent-kafka Broker管理 Kafka Broker APIKafka查看Broker 的状态 八、学习路径 学习指南 Kafka 三期培训大纲(完善版)Kafka的学习路径规划kafka入坑 整理依据:文章内容关联性(如监控类归入巡检、JVM相关归入性能优化)、技术层次(基础概念/高级调优)、应用场景(部署/安全/工具链)。