Kafka
二百四十九先森
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Kafka入门第四课:Kafka节点数、分区数、分区副本数设置及Kafka压力测试
一、分区副本数设置 由于分区副本仅提供数据冗余的功能,且分区副本数量与集群吐吞量负相关,故冗余度在满足安全要求基础上设置为最小即可。 故我们不妨将分区副本数设置为2.二、kafka分区数设置通过对单个分区的topic进行消费者和生产者的压力测试,得出单个分区所能提供的消费和生产的最大峰值吐吞量。1、创建只有一个分区的topic。kafka-topics.sh --create \--zookeeper Linux001:2181 \--partitions 1 \--repl.原创 2021-11-04 15:59:25 · 6334 阅读 · 0 评论 -
Kafak入门第三课:kafka数据格式及各版本占用的空间大小对比
0.9版本1、消息集Message set 一个消息集中包含一条或多条消息,消息集不仅是存储在磁盘及网络传输的基本形式,而且是kafka压缩的基本单元。2、消息Recode一个recode是由多个key-value键值对组成,以下介绍各个key的含义。 CRC32,大小4B。CRC校验值,校验范围为magic到value之间。 magic,大小1B。 消息格式版本号。 attributes,大小1B。 消息类型,最低三位为压缩类型。0 无 1 gzip 2原创 2021-10-11 18:40:48 · 1539 阅读 · 0 评论 -
Kafka入门第二课:Producer&Consumer api和自定义拦截器与分区器
1、kafka是啥? kafka是一个高吞吐的分布式消息系统。2、作用 解耦:SparkStreaming与flume之间以及hdfs与flume之间。 缓冲:数据高峰时减小hdfs和SparkStreaming压力,起缓冲作用。kafka消费速度可设置。 异步通信:###注: kafka最主要的作用就是用来做缓冲中间件3、特点及优势 ...原创 2018-03-22 12:34:00 · 472 阅读 · 0 评论 -
Kafka入门第一课:kafka的简单介绍
1、kafka是啥? kafka是一个高吞吐的分布式消息系统。2、作用 解耦:SparkStreaming与flume之间以及hdfs与flume之间。 缓冲:数据高峰时减小hdfs和SparkStreaming压力,起缓冲作用。kafka消费速度可设置。 异步通信:###注: kafka最主要的作用就是用来做缓冲中间件3、特点及优势 ...原创 2018-03-12 10:12:02 · 364 阅读 · 0 评论 -
Kafka最强教程
链接:https://blog.youkuaiyun.com/ychenfeng/article/details/74980531KafkaKafka是最初由Linkedin公司开发,是一个分布式、支持分区的(partition)、多副本的(replica),基于zookeeper协调的分布式消息系统,它的最大的特性就是可以实时的处理大量数据以满足各种需求场景:比如基于hadoop的批处理系统、低延迟的实时系...转载 2018-04-28 09:47:37 · 2337 阅读 · 0 评论
分享