kafka
爱吃甜食_
一点点进步,让编程更有趣
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
kafka kafka如何只保证数据被处理切只处理一次思路
kafka如何只保证数据被处理切只处理一次思路kafka如何只保证数据被处理切只处理一次思路kafka如何只保证数据被处理切只处理一次思路如果消费者这端要保证数据被处理且只被处理一次:屏蔽掉了下面这2种情况:(1)数据的重复处理(2)数据的丢失一般来说:需要手动提交偏移量,需要保证数据处理成功与保存偏移量的操作在同一事务中就可以了...原创 2020-08-25 00:15:51 · 365 阅读 · 1 评论 -
kafka-11 Coordinator与offset管理和Consumer Rebalance
Coordinator与offset管理和Consumer Rebalancekafka的offset管理kafka之coordinatorcoordinator的作用coordinator的选择consumer消费策略的制定consumer消费者Rebalance什么是rebalance?rebalance的触发条件有三种:range范围策略(默认策略)round-robin轮训策略sticky粘性策略消费者分配策略设置kafka的offset管理kafka在0.8(含)之前的版本都是用ZK来管理o原创 2020-08-25 00:10:25 · 519 阅读 · 0 评论 -
kafka-10 broker核心参数
server.properties配置文件核心参数broker.id每个broker都必须自己设置的一个唯一idlog.dirs这个极为重要,kafka的所有数据就是写入这个目录下的磁盘文件中的,如果说机器上有多块物理硬盘,那么可以把多个目录挂载到不同的物理硬盘上,然后这里可以设置多个目录,这样kafka可以数据分散到多块物理硬盘,多个硬盘的磁头可以并行写,这样可以提升吞吐量。zookeeper.connect连接kafka底层的zookeeper集群的Listenersbr原创 2020-08-24 16:22:19 · 176 阅读 · 0 评论 -
kafka-9 producer核心参数
producer核心参数生产者代码常见异常处理提升消息吞吐量请求超时ACK参数重试乱序生产者代码/** * 需求:开发kafka生产者代码 */public class KafkaProducerStudyDemo { public static void main(String[] args) throws ExecutionException, InterruptedException { //准备配置属性 Properties props = new原创 2020-08-24 16:20:41 · 222 阅读 · 0 评论 -
kafka 必知必会
对kafka一些知识点进行简单的陈述,mark一下。kafka必知必会1kafka必知必会2kafka必知必会3原创 2020-08-24 15:52:57 · 145 阅读 · 0 评论 -
kafka-8 producer发送原理
producer发送原理producer发送核心流程概览发送过程代码实现producer发送核心流程概览发送过程1、ProducerInterceptors是一个拦截器,对发送的数据进行拦截ps:实际用处不大,过滤,拦截消息,在直接发送数据之前自己用代码过滤即可2、Serializer 对消息的key和value进行序列化3、通过使用分区器作用在每一条消息上,实现数据分发进行入到topic不同的分区中4、RecordAccumulator收集消息,实现批量发送原创 2020-08-24 12:08:33 · 411 阅读 · 0 评论 -
kafka-7 kafka内核机制之《ISR机制和HW&LEO原理》
ISR机制和HW&LEO原理ISR机制HW&LEO原理LEOHW更新LEO机制follower更新LEOleader更新LEO更新HW机制follower更新HWleader更新HW时机leader更新HW的方式HW和LEO更新流程图扩展ISR机制ISR机制通过只选举在ISR列表中的follower作为新的leader来保证kafka数据的不丢失。ISR:即in-sync replica,就是跟leader partition保持同步的follower partition的数量,只有处原创 2020-08-24 00:24:25 · 1367 阅读 · 0 评论 -
kafka kafka监控工具
kafka监控工具Kafka ManagerKafkaOffsetMonitorKafka EagleKafka ManagerkafkaManager它是由雅虎开源的可以监控整个kafka集群相关信息的一个工具。(1)可以管理几个不同的集群(2)监控集群的状态(topics, brokers, 副本分布, 分区分布)(3)创建topic、修改topic相关配置1、上传安装包kafka-manager-1.3.0.4.zip2、解压安装包unzip kafka-manager原创 2020-08-23 11:32:16 · 381 阅读 · 0 评论 -
kafka kafka整合flume
kafka整合flumekafka整合flume启动kafka控制台消费者,验证数据写入成功flume官网kafka整合flume在flume下的conf中添加flume的配置vi flume-kafka.conf#为我们的source channel sink起名a1.sources = r1a1.channels = c1a1.sinks = k1#指定我们的source数据收集策略a1.sources.r1.type = spooldira1.sources.r1.spo原创 2020-08-23 11:13:55 · 292 阅读 · 0 评论 -
kafka-6 kafka快速读取解析
kafka快速读取解析顺序读写页缓存(Page Cache)零拷贝(sendfile)常规数据文件传输总结补充:关于零拷贝内存中有几分bufferkafka作为消息中间件,虽然是基于磁盘做数据存储。但是有高性能、高吞吐、低延迟等特点。顺序读写磁盘顺序读写性能高于内存的随机读写kafka将消息记录持久化到磁盘,有新消息时,通过不断追加的方式将message追加到文件磁盘末尾页缓存(Page Cache)kafka利用了操作系统本身的 page cache,即利用的是操作系统自身的内存而不是JVM空原创 2020-08-22 23:37:52 · 484 阅读 · 0 评论 -
kafka-5 kafka的文件存储机制和日志分段机制、查找机制、清除机制
kafka的文件存储机制概述segment fileindex文件和log文件字段的对应关系日志和索引文件参数的含义日志分段的策略segment文件的命名和滚动生成新文件规则kafka查找机制offset查找时间戳查找日志清理概述生产者生产的消息按照一定的分区策略发送到topic的partition中去。同一个topic下有多个partition,每个partition在磁盘上就是一个目录。partition的命名规则是topic的名称加上一个序号,序号从0开始。下图为topic名为test对应的p原创 2020-08-22 19:13:12 · 1514 阅读 · 0 评论 -
kafka-4 kafka分区策略
kafka分区策略kafka分区策略指定具体分区号不给定具体分区号,给定key值(key值不断变化)不给定具体分区号,也不给对应的key自定义分区kafka分区策略kafka分区策略决定producer生产者生产的消息最终会写入到topic的哪个分区中。kafka分区策略有以下四种指定具体分区号不给定具体分区号,给定key值(key值不断变化)不给定具体分区号,也不给定对应的key自定义分区实际上kafka还有一种分区策略,即随机分区,因为负载均衡不如轮训,所以很少使用。kafka默认原创 2020-08-22 10:52:18 · 488 阅读 · 0 评论 -
kafka-3 生产者消费者api代码demo
生产者消费者api代码demo 生产者代码消费者代码自动提交偏移量手动提交偏移量pom依赖生产者代码public class producer { public static void main(String[] args) { //准备配置属性 Properties props = new Properties(); //kafka集群地址 props.put("bootstrap.servers", "node01:9092,原创 2020-08-22 09:56:04 · 371 阅读 · 0 评论 -
kafka-2 命令行基本操作
kafka命令行基本操作启动一键启动kafka停止一键停止一键启动和停止脚本启动停止创建topic查询所有的topic查看topic的描述信息删除topic模拟生产者写入数据到topic中模拟消费者拉取topic中的数据启动kafka依赖ZK集群,先启动ZK集群在kafka集群的所有节点上执行# /kafka是我的kafka安装路径nohup kafka-server-start.sh /kafka/config/server.properties >/dev/null 2>&am原创 2020-08-21 21:41:06 · 785 阅读 · 0 评论 -
kafka-1kafka基本概念和集群架构
kafka基本概念和集群架构消息系统的意义kafka前身和概念kafka前身kafka概念kafaka特性kafka集群架构kafka集群中的角色消息系统的意义解耦生产者和消费者可以单独的进行扩展和修改,只需要遵循同样的接口约束就行扩展性因为解耦特性,可以单独的增加消息入队和处理频率冗余和防止数据丢失消息队列接受大量的数据并将数据持久化,直到被消费为止从消息队里删除数据前,需要处理系统明确的告知消息队里已处理完数据,从而保证了数据不会丢失。灵活性和峰值处理能力原创 2020-08-20 23:41:25 · 1390 阅读 · 0 评论 -
Kafka创建Topic时如何将分区放置到不同的Broker中
原文地址,mark一下转载 2020-08-20 21:47:28 · 337 阅读 · 0 评论
分享