kafka 压力测试

最新推荐文章于 2024-05-24 09:19:11 发布

原创

最新推荐文章于 2024-05-24 09:19:11 发布 · 440 阅读

1 ·

CC 4.0 BY-SA版权

本文介绍了如何使用Kafka官方脚本进行Producer和Consumer的压力测试，通过测试观察CPU、内存、网络IO等指标，分析性能瓶颈。测试结果显示最大吞吐率为9.5368MB/s，平均消费速度为2.0714MB/s。Kafka机器数量的经验公式为：2*(峰值生产速度*副本数/100) + 1，以此预估部署所需Kafka的数量。

1）Kafka压测
用Kafka官方自带的脚本，对Kafka进行压测。Kafka压测时，可以查看到哪个地方出现了瓶颈（CPU，内存，网络IO）。一般都是网络IO达到瓶颈。

kafka-consumer-perf-test.sh
kafka-producer-perf-test.sh

2）Kafka Producer压力测试
（1）在/opt/module/kafka/bin目录下面有这两个文件。我们来测试一下

[atguigu@hadoop102 kafka]$ bin/kafka-producer-perf-test.sh  --topic test --record-size 100 --num-records 100000 --throughput 1000 --producer-props bootstrap.servers=hadoop102:9092,hadoop103:9092,hadoop104:9092
说明：record-size是一条信息有多大，单位是字节。num-records是总共发送多少条信息。throughput 是每秒多少条信息。

（2）Kafka会打印下面的信息

5000 records sent, 999.4 records/sec (0.10 MB/sec), 1

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

不言尘世

关注关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

Kafka入门(4) -- kafka基准测试

erainm

09-15

441

1. 基准测试基准测试（benchmark testing）是一种测量和评估软件性能指标的活动。我们可以通过基准测试，了解到软件、硬件的性能水平。主要测试负载的执行时间、传输速度、吞吐量、资源占用率等。 1.1 基于1个分区1个副本的基准测试测试步骤：启动Kafka集群创建一个1个分区1个副本的topic: benchmark 同时运行生产者、消费者基准测试程序观察结果 1.1.1 创建topic bin/kafka-topics.sh --zookeeper node1:2181 --c

【Kafka-3.x-教程】-【七】Kafka 生产调优、Kafka 压力测试

weixin_53543905的博客

01-10

1694

那么当生产者向一个未创建的主题发送消息时，会自动创建一个分区数为 num.partitions（默认值为1）、副本因子为 default.replication.factor（默认值为 1）的主题。：默认是 none，不压缩，但是也可以使用 lz4 压缩，效率还是不错的，压缩之后可以减小数据量，提升吞吐量，但是会加大 producer 端的 CPU 开销。服务器台数 = 2 * （生产者峰值生产速率 * 副本 / 100） + 1 = 2 * （20m/s * 2 / 100） + 1 = 3 台。

参与评论您还未登录，请先登录后发表或查看评论

kafka压测

weixin_63302986的博客

05-24

1041

num.network.threads：broker处理消息的最大线程数，和我们生产消费的thread很类似主要处理网络io，读写缓冲区数据，基本没有io等待，建议配置线程数量为cpu核数加1；在服务器上使用Kafka自带的测试脚本，模拟1y级别的消息写入以及读取请求，查看Kafka处理不同数量级的消息数时的处理能力，包括每秒生成消息数、吞吐量、消息延迟时间。througout:我们所需要的吞吐量，单位时间内处理消息的数量，可能对我们处理消息的延迟有影响；

Kafka压力测试

weixin_42796403的博客

12-09

735

Kafka压力测试 一、Kafka压测用Kafka官方自带的脚本，对Kafka进行压测。Kafka压测时，可以查看到哪个地方出现了瓶颈**（CPU，内存，网络IO）。一般都是网络IO达到瓶颈**。 kafka-consumer-perf-test.sh kafka-producer-perf-test.sh 二、Kafka Producer压力测试（1）在/opt/module/kafka/bin目录下面有这两个文件 [hadoop@hadoop102 kafka]$ bin/kafka-prod

Hadoop_Kafka安装

qq_56870570的博客

08-17

1150

1. 安装部署 1.1 集群规划 hadoop102 hadoop103 hadoop104 zk zk zk kafka kafka kafka 1.2 jar包下载 http://kafka.apache.org/downloads 1.3 集群部署 1）解压安装包 [muzili@hadoop102

kafka压力测试（官方自带）

lck_csdn的博客

12-22

893

1、Kafka压测用Kafka官方自带的脚本，对Kafka进行压测。Kafka压测时，可以查看到哪个地方出现了瓶颈（CPU，内存，网络IO）。一般都是网络IO达到瓶颈。 kafka-consumer-perf-test.sh kafka-producer-perf-test.sh 2、Kafka Producer压力测试在…/kafka/bin目录下 [duoduo@hadoop100 kafka_2.11-2.4.0]$ bin/kafka-producer-perf-test.sh --top

Kafka压测报告

伤心的辣条

04-24

1214

本次性能测试在测试环境下单台服务器上Kafka处理MQ消息能力进行压力测试。测试包括对Kafka写入MQ消息和消费MQ消息进行压力测试，根据1w、10w和100w级别的消息处理结果，评估Kafka的处理性能是否满足项目需求。

Kafka压力测试(自带测试脚本)(单机版)

shykevin的博客

12-06

1000

Kafka压力测试(自带测试脚本)(单机版) 一、测试目的本次性能测试在正式环境下单台服务器上Kafka处理MQ消息能力进行压力测试。测试包括对Kafka写入MQ消息和消费MQ消息进行压力测试，根据10w、100w和1000w级别的消息处理结果，评估Kafka的处理性能是否满足项目需求。（该项目期望Kafka能够处理上亿级别的M...

kafka压力测试

weixin_46153092的博客

04-30

510

一、kafka压力测试 1、写入mq的消息 100000条 ./kafka-producer-perf-test.sh --topic topic_001 --num-records 100000 --record-size 1000 --throughput 200 --producer-props bootstrap.servers=bigdata1:6667,bigdata:6667,bigdata:6667 kafka-producer-perf-test.sh 脚本命令的参数解析 –topic

Kafka压力测试（官方自带）

hyunbar的博客

06-27

5855

Kafka 的压测

小憨憨的博客

12-10

327

Kafka 官方提供了压测脚本 kafka-consumer-perf-test.sh 、 kafka-producer-perf-test.sh。通过脚本执行可以检查是否存在一些瓶颈； producer 压测： /opt/cloudera/parcels/CDH/lib/kafka/bin/kafka-producer-perf-test.sh \ --topic test --record-size 1000 --num-records 1000000 --throughput

Kafka性能压测完整版

最新发布

02-25

<think>嗯，用户想了解如何使用Java代码进行Kafka的压力测试。首先，我需要明确压力测试的目的，通常是评估Kafka在高负载下的性能，比如吞吐量、延迟和资源使用情况。然后，我得考虑使用哪些工具或框架。Kafka自带了kafka-producer-perf-test和kafka-consumer-perf-test脚本，但用户可能更希望用Java代码来实现，这样更灵活。接下来，我得回忆一下用Java进行压力测试的常见方法。通常，可以编写生产者和消费者客户端，模拟大量消息的发送和接收。需要用到Kafka的Producer和Consumer API。对于生产者，需要配置参数如bootstrap.servers、acks、linger.ms、batch.size等，以优化性能。同样，消费者端需要配置合适的参数，比如fetch.min.bytes、max.poll.records等。然后，考虑如何设计测试用例。可能需要多线程来模拟并发用户，或者使用线程池来同时启动多个生产者和消费者。同时，需要记录发送和接收的消息数量、时间，以便计算吞吐量和延迟。此外，可能需要统计成功发送的消息数、失败数，以及消费者的处理速度。用户可能还需要了解如何监控测试过程中的指标，比如使用Kafka的内置指标或者集成监控工具如JMX、Prometheus。不过，这部分可能超出了代码示例的范围，但可以简要提及。另外，需要注意在压力测试时，Kafka集群的配置，比如分区数量、副本因子等，这些都会影响性能。用户可能需要根据测试结果调整这些参数。不过，用户的问题主要集中在Java代码实现，所以这部分可能作为后续建议。可能还需要提到第三方工具，比如Apache JMeter，或者使用Kafka自带的性能测试脚本，但用户明确要求用Java代码的方式，所以需要集中在代码示例上。现在，我需要组织这些思路，提供一个结构化的回答。首先介绍压力测试的目的，然后分步骤说明如何实现生产者和消费者的测试，给出代码示例，并解释关键配置参数。最后，可以给出运行建议和注意事项，比如逐步增加负载、监控系统指标等。需要确保代码示例的正确性，比如正确创建ProducerRecord，处理回调，正确关闭生产者。同时，消费者部分可能需要使用多线程来并发消费，或者使用Consumer的poll方法持续拉取消息。还要注意资源管理，比如在测试结束后关闭所有线程和客户端，避免资源泄漏。另外，可能需要使用计数器来统计发送和接收的消息数量，使用原子变量来保证线程安全。最后，提醒用户根据测试结果调整配置，比如调整批处理大小、压缩方式、确认机制等，以达到最佳性能。</think>以下是使用 Java 代码进行 Kafka 压力测试的常见方法和示例： --- ### **1. 压力测试目标** - **生产者**：测试最大消息发送吞吐量（如 messages/sec 或 MB/sec） - **消费者**：测试消息拉取和处理速度 - **综合场景**：模拟高并发下的端到端延迟和稳定性 --- ### **2. 核心依赖** 在 `pom.xml` 中添加 Kafka 客户端依赖： ```xml <dependency> <groupId>org.apache.kafka</groupId> <artifactId>kafka-clients</artifactId> <version>3.6.0</version> </dependency> ``` --- ### **3. 生产者压力测试示例** ```java import org.apache.kafka.clients.producer.*; public class KafkaProducerStressTest { private static final String TOPIC = "stress-test-topic"; private static final String BOOTSTRAP_SERVERS = "localhost:9092"; private static final int MESSAGE_COUNT = 1000000; // 目标发送消息数 public static void main(String[] args) { // 配置生产者参数（关键优化参数） Properties props = new Properties(); props.put(ProducerConfig.BOOTSTRAP_SERVERS_CONFIG, BOOTSTRAP_SERVERS); props.put(ProducerConfig.ACKS_CONFIG, "1"); // 平衡速度与可靠性 props.put(ProducerConfig.LINGER_MS_CONFIG, 10); // 批量发送延迟 props.put(ProducerConfig.BATCH_SIZE_CONFIG, 16384); // 批次大小 props.put(ProducerConfig.COMPRESSION_TYPE_CONFIG, "snappy"); // 压缩提升吞吐 props.put(ProducerConfig.KEY_SERIALIZER_CLASS_CONFIG, "org.apache.kafka.common.serialization.StringSerializer"); props.put(ProducerConfig.VALUE_SERIALIZER_CLASS_CONFIG, "org.apache.kafka.common.serialization.StringSerializer"); KafkaProducer<String, String> producer = new KafkaProducer<>(props); long startTime = System.currentTimeMillis(); try { for (int i = 0; i < MESSAGE_COUNT; i++) { String key = "key-" + i; String value = "value-" + System.currentTimeMillis(); ProducerRecord<String, String> record = new ProducerRecord<>(TOPIC, key, value); // 异步发送（同步会大幅降低吞吐） producer.send(record, (metadata, exception) -> { if (exception != null) { System.err.println("发送失败: " + exception.getMessage()); } }); // 进度跟踪 if (i % 10000 == 0) { System.out.println("已发送: " + i + " 条消息"); } } } finally { producer.close(); long duration = System.currentTimeMillis() - startTime; System.out.printf("总耗时: %d ms, 吞吐量: %.2f msg/s%n", duration, (MESSAGE_COUNT * 1000.0) / duration); } } } ``` --- ### **4. 消费者压力测试示例** ```java import org.apache.kafka.clients.consumer.*; public class KafkaConsumerStressTest { private static final String TOPIC = "stress-test-topic"; private static final String BOOTSTRAP_SERVERS = "localhost:9092"; private static final int POLL_TIMEOUT = 100; // ms public static void main(String[] args) { Properties props = new Properties(); props.put(ConsumerConfig.BOOTSTRAP_SERVERS_CONFIG, BOOTSTRAP_SERVERS); props.put(ConsumerConfig.GROUP_ID_CONFIG, "stress-test-group"); props.put(ConsumerConfig.AUTO_OFFSET_RESET_CONFIG, "earliest"); props.put(ConsumerConfig.KEY_DESERIALIZER_CLASS_CONFIG, "org.apache.kafka.common.serialization.StringDeserializer"); props.put(ConsumerConfig.VALUE_DESERIALIZER_CLASS_CONFIG, "org.apache.kafka.common.serialization.StringDeserializer"); props.put(ConsumerConfig.FETCH_MIN_BYTES_CONFIG, 1024); // 减少拉取频率 props.put(ConsumerConfig.MAX_POLL_RECORDS_CONFIG, 500); // 单次拉取最大记录数 KafkaConsumer<String, String> consumer = new KafkaConsumer<>(props); consumer.subscribe(Collections.singletonList(TOPIC)); long startTime = System.currentTimeMillis(); int messageCount = 0; try { while (true) { ConsumerRecords<String, String> records = consumer.poll(Duration.ofMillis(POLL_TIMEOUT)); if (records.isEmpty()) break; for (ConsumerRecord<String, String> record : records) { messageCount++; // 模拟消息处理（可在此添加处理逻辑） } // 手动提交偏移量（按需选择同步/异步） consumer.commitAsync(); } } finally { consumer.close(); long duration = System.currentTimeMillis() - startTime; System.out.printf("消费 %d 条消息, 耗时: %d ms, 吞吐量: %.2f msg/s%n", messageCount, duration, (messageCount * 1000.0) / duration); } } } ``` --- ### **5. 关键优化参数** | **生产者参数** | **说明** | |------------------------------|-----------------------------------| | `acks` | 0（最快）、1（默认）、all（最可靠）| | `compression.type` | snappy/lz4/zstd 压缩减少网络开销 | | `batch.size` / `linger.ms` | 控制批量发送行为 | | **消费者参数** | **说明** | |------------------------------|-----------------------------------| | `fetch.min.bytes` | 单次拉取最小数据量 | | `max.poll.records` | 单次拉取最大消息数 | | `max.partition.fetch.bytes` | 单分区最大拉取量 | --- ### **6. 执行建议** 1. **逐步增压**：从低并发开始，逐步增加线程/消息量 2. **监控指标**：使用 `kafka-producer-perf-test.sh` / `kafka-consumer-perf-test.sh` 对比测试 3. **资源监控**：观察 CPU、网络、磁盘 IO 是否成为瓶颈 4. **集群配置**：根据测试结果调整分区数、副本因子等 --- ### **7. 高级技巧** - **多线程生产/消费**：使用线程池模拟并发客户端 - **消息去重校验**：在消息体中加入序列号，验证数据完整性 - **端到端延迟测量**：在消息中记录发送时间戳，消费时计算延迟通过调整参数和代码逻辑，可灵活模拟各种压力场景。建议结合 JMX 监控（如 `kafka.producer:type=producer-metrics`）深入分析性能瓶颈。