
Kafka
Kafka
cts618
算法高级工程师
展开
-
kafka生产者数据可靠性保证
kafka生产者数据可靠性保证原创 2022-09-02 12:52:53 · 221 阅读 · 0 评论 -
kafka生产者如何提高吞吐量
kafka生产者如何提高吞吐量原创 2022-09-02 11:58:37 · 205 阅读 · 0 评论 -
Kafka工具类
package com.cnic.utils;import org.apache.flink.api.common.serialization.SimpleStringSchema;import org.apache.flink.api.common.typeinfo.BasicTypeInfo;import org.apache.flink.api.common.typeinfo.TypeInformation;import org.apache.flink.streaming.connect.原创 2022-05-27 10:10:43 · 374 阅读 · 0 评论 -
Kafka 事务
Kafka 从 0.11 版本开始引入了事务支持。事务可以保证 Kafka 在 Exactly Once 语义的基础上,生产和消费可以跨分区和会话,要么全部成功,要么全部失败。Producer 事务为了实现跨分区跨会话的事务,需要引入一个全局唯一的 Transaction ID,并将 Producer获得的PID 和Transaction ID 绑定。这样当Producer 重启后就可以通过正在进行的 TransactionID 获得原来的 PID。为了管理 Transaction,Kafka 引入了原创 2021-06-08 09:04:43 · 107 阅读 · 0 评论 -
Zookeeper 在 Kafka 中的作用
Kafka 集群中有一个 broker 会被选举为 Controller,负责管理集群 broker 的上下线,所有 topic 的分区副本分配和 leader 选举等工作。Controller 的管理工作都是依赖于 Zookeeper 的。以下为 partition 的 leader 选举过程:...原创 2021-06-08 08:51:38 · 181 阅读 · 0 评论 -
kafka生产者之 Exactly Once
Exactly Once 语义将服务器的 ACK 级别设置为-1,可以保证 Producer 到 Server 之间不会丢失数据,即 AtLeast Once 语义。相对的,将服务器 ACK 级别设置为 0,可以保证生产者每条消息只会被发送一次,即 At Most Once 语义。At Least Once 可以保证数据不丢失,但是不能保证数据不重复;相对的,At Least Once可以保证数据不重复,但是不能保证数据不丢失。但是,对于一些非常重要的信息,比如说交易数据,下游数据消费者要求数据既不重原创 2021-06-08 08:37:36 · 200 阅读 · 0 评论 -
kafka数据一致性问题
(1)follower故障follower发生故障后会被临时踢出ISR,待该follower恢复后,follower会读取本地磁盘记录的上次的HW,并将log文件高于HW的部分截取掉,从HW开始向leader进行同步。等该follower的LEO大于等于该Partition的HW,即follower追上leader之后,就可以重新加入ISR了。(2)leader故障leader发生故障之后,会从ISR中选出一个新的leader,之后,为保证多个副本之间的数据一致性,其余的follower会先将各自的.原创 2021-06-08 08:31:08 · 592 阅读 · 0 评论 -
Kafka高效读写数据
1)Kafka本身是分布式集群,同时采用分区技术,并发度高。2)顺序写磁盘Kafka的producer生产数据,要写入到log文件中,写的过程是一直追加到文件末端,为顺序写。官网有数据表明,同样的磁盘,顺序写能到600M/s,而随机写只有100K/s。这与磁盘的机械机构有关,顺序写之所以快,是因为其省去了大量磁头寻址的时间。3)零复制技术...原创 2021-06-08 07:58:36 · 114 阅读 · 0 评论 -
kafka生产者数据可靠性保证之同步副本队列ISR
(1)问题引出:采用第二种方案之后,设想以下情景:leader 收到数据,所有 follower 都开始同步数据,但有一个 follower,因为某种故障,迟迟不能与 leader 进行同步,那 leader 就要一直等下去,直到它完成同步,才能发送 ack。这个问题怎么解决呢?(2)解决方案:Leader 维护了一个动态的 in-sync replica set (ISR),意为和 leader 保持同步的 follower 集合。当 ISR 中的 follower 完成数据的同步之后,lead原创 2021-06-08 07:26:52 · 239 阅读 · 0 评论 -
kafka生产者数据可靠性
为保证 producer 发送的数据,能可靠的发送到指定的 topic,topic 的每个 partition 收到producer 发送的数据后,都需要向 producer 发送 ack(acknowledgement 确认收到),如果producer 收到 ack,就会进行下一轮的发送,否则重新发送数据。1)副本数据同步策略Kafka 选择了第二种方案,原因如下:1.同样为了容忍 n 台节点的故障,第一种方案需要 2n+1 个副本,而第二种方案只需要 n+1个副本,而 Kafka 的每个原创 2021-06-08 07:20:26 · 245 阅读 · 0 评论 -
IDEA中itar快捷键
for (int i = 0; i < array.length; i++) {= array[i]; }原创 2021-04-30 06:19:52 · 476 阅读 · 0 评论 -
IT实用网站大全
http://www.winwin7.com/原创 2021-03-28 10:22:33 · 216 阅读 · 0 评论 -
win10中ctrl+space快捷键不起作用的问题
win10中默认的ctrl+space为切换中英文,这与很多IDE中的提示代码快捷键冲突,所以需要进行修改。注:仅仅在控制面板中修改快捷键是不行的,每次重启就会恢复。步骤1:按win+R打开运行页面,输入regedit(注册表页面),进入如图1所示页面。依次进入HKEY_CURRENT_USER/Control Panel/Input Method/Hot Keys右侧显示表中有:将Key Modifiers 中开头的02改为00将Virtual Key 中开头的20改为ff用户注销即可原创 2021-03-11 13:03:02 · 2404 阅读 · 1 评论 -
问题大全
1、kafka-manager在哪启动,start.log就输出到哪,如何指定kafka-manager输出目录???2、kafka-manager原创 2019-12-01 13:36:14 · 121 阅读 · 0 评论