
消息队列【kafka】
文章平均质量分 63
.NET跨平台
比较认真。编程就是算法和数据结构,算法和数据结构是编程的灵魂。
展开
-
kafka应用场景
Apache Kafka 是一个分布式流处理平台,通常用于处理和管理大量的实时数据流。它具有高吞吐量、可伸缩性和持久性等特点,因此在各种应用场景中都有广泛的应用。这些只是 Kafka 的一些常见应用场景,实际上,Kafka 可以在许多领域中用于实现实时数据流处理和事件驱动的架构。它的灵活性和可扩展性使得它成为大规模数据处理和流处理的关键组件之一。原创 2023-09-24 15:03:19 · 933 阅读 · 0 评论 -
.NET Core 下使用 Kafka
Broker:消息中间件处理节点,一个Kafka节点就是一个broker,多个broker可以组成一个Kafka集群。Topic:一类消息,例如page view日志、click日志等都可以以topic的形式存在,Kafka集群能够同时负责多个topic的分发。Partition:topic物理上的分组,一个topic可以分为多个partition,每个partition是一个有序的队列。Segmentpartition物理上由多个segment组成,下面2.2和2.3有详细说明。offset。转载 2022-12-13 17:35:58 · 1546 阅读 · 0 评论 -
CentOS 安装 kafka
【代码】CentOS 安装 kafka。转载 2022-12-13 17:25:51 · 472 阅读 · 0 评论 -
.Net Core 集成 Kafka
最近维护的一个系统并发有点高,所以想引入一个消息队列来进行削峰。考察了一些产品,最终决定使用kafka来当做消息队列。以下是关于kafka的一些知识的整理笔记。kafkakafka 是分布式流式平台。它由linkedin开发,后贡献给了Apache开源组织并成为顶级开源项目。它可以应用在高并发场景下的日志系统,也可以当作消息队列来使用,也可以当作消息服务对系统进行解耦。流处理平台有以下三种特性:可以让你发布和订阅流式的记录。这一方面与消息队列或者企业消息系统类似。可以储存流式的记录,并且有较好转载 2022-05-18 21:18:53 · 1214 阅读 · 1 评论 -
Kafka思维导图(二)
Kafka源码——KafkaConsumer核心流程(version-0.10.1.0)KafkaConsumer核心流程Kafka源码——KafkaConsumer核心流程(version-0.10.1.0)kafka详细说明kafkaKAFKA转载 2022-05-04 00:25:37 · 295 阅读 · 0 评论 -
kafka在高并发的情况下,如何避免消息丢失和消息重复?
1.为什么会发生消息丢失和消息重复?消息发送Kafka消息发送有两种方式:同步(sync)和异步(async),默认是同步方式,可通过producer.type属性进行配置。Kafka通过配置request.required.acks属性来确认消息的生产:0—表示不进行消息接收是否成功的确认;1—表示当Leader接收成功时确认;-1—表示Leader和Follower都接收成功时确认;综上所述,有6种消息生产的情况,下面分情况来分析消息丢失的场景:(1)acks=0,不和Kafka集群进转载 2020-07-10 11:38:07 · 1205 阅读 · 1 评论 -
Kafka集群配置---Windows版
Kafka是一种高吞吐量的分布式发布订阅的消息队列系统,Kafka对消息进行保存时是通过tipic进行分组的。今天我们仅实现Kafka集群的配置。前言最近研究kafka,发现网上很多关于kafka的介绍都是基于Linux操作系统的。虽然这些服务最后都是配置Linux上的。但是我们平时使用的大多都是Windows系统。所以研究很是吃力。经过借鉴不同的网络文章终于在Windows上实现了kafka的配置转载 2017-09-13 11:51:29 · 1132 阅读 · 0 评论 -
window环境搭建zookeeper,kafka集群
本文是对在window环境下如何搭建zookeeper集群和kafka集群的研究,如果你正在查找相关此类资料,希望本文能对你有所帮助。网上很多资料关于”kafka集群”几乎都是一个模样,写得东西很类似,而且很多细节没有注明,需要在不断的测试过程中推敲才能得到理想的结果。本篇文章力求能尽量说明每一个细节每一个步骤,达到只要认真看过本文者都能自己搭建一个基于window的kafka集群环境,当然这里仅代转载 2017-09-13 10:43:09 · 902 阅读 · 0 评论 -
Kafka设计与原理详解
一、Kafka简介本文综合了我之前写的kafka相关文章,可作为一个全面了解学习kafka的培训学习资料。1.1 背景历史当今社会各种应用系统诸如商业、社交、搜索、浏览等像信息工厂一样不断的生产出各种信息,在大数据时代,我们面临如下几个挑战:如何收集这些巨大的信息如何分析它如何及时做到如上两点以上几个挑战形成了一个业务需求模型,即生产者生产(produce)各种信息,消费者消费(consume转载 2017-09-13 09:47:40 · 834 阅读 · 0 评论 -
Kafka.net使用编程入门(二)
1.首先创建一个Topic,命令如下:kafka-topics --create --zookeeper localhost:2181 --replication-factor 1 --partitions 1 --topic MyTopic2.创建两个控制台程序: 3.KafkaProducer程序: class Program {原创 2016-06-29 22:20:25 · 5661 阅读 · 2 评论 -
Kafka.net使用编程入门(三)
这个世界既不是有钱人的世界,也不是有权人的世界,它是有心人的世界。一些有用的命令1.列出主题:kafka-topics.bat –list –zookeeper localhost:21812.描述主题:kafka-topics.bat –describe –zookeeper localhost:2181 –topic [Topic Name]3.从头读取消息:kafka-console-cons原创 2016-12-14 23:32:00 · 4994 阅读 · 3 评论 -
Kafka入门经典(官网翻译)
Kafka独特设计在什么地方?Kafka如何搭建及创建topic、发送消息、消费消息?如何书写Kafka程序?数据传输的事务定义有哪三种?Kafka判断一个节点是否活着有哪两个条件?producer是否直接将数据发送到broker的leader(主节点)?Kafa consumer是否可以消费指定分区消息?Kafka消息是采用Pull模式,还是Push模式?Procuder API有转载 2016-12-14 21:56:28 · 1082 阅读 · 2 评论 -
kafka详解一、Kafka简介
背景: 当今社会各种应用系统诸如商业、社交、搜索、浏览等像信息工厂一样不断的生产出各种信息,在大数据时代,我们面临如下几个挑战:如何收集这些巨大的信息如何分析它 如何及时做到如上两点以上几个挑战形成了一个业务需求模型,即生产者生产(produce)各种信息,消费者消费(consume)(处理分析)这些信息,而在生产者与消费者之间,需要一个沟通两者的桥梁-消息系统。转载 2017-09-12 13:08:38 · 1053 阅读 · 0 评论 -
Kafka详解二、如何配置Kafka集群
Kafka集群配置比较简单,为了更好的让大家理解,在这里要分别介绍下面三种配置单节点:一个broker的集群单节点:多个broker的集群多节点:多broker集群一、单节点单broker实例的配置1. 首先启动zookeeper服务Kafka本身提供了启动zookeeper的脚本(在kafka/bin/目录下)和zookeeper配置文件(在kafka/config/目录下),首先进入Kaf转载 2017-09-12 13:54:59 · 786 阅读 · 0 评论 -
kafka 0.9.0.0重复消费问题解决
背景:之前用的kafka客户端版本是0.8,近期升级了kafka客户端的版本,写了新的消费者和生产者的代码,在本地测试没有问题,可以正常消费与生产。但最近的项目中使用了新版的代码,当数据量较大时会出现重复消费的问题。现将问题的排除与解决过程记录下来,避免再次踩坑。问题发现:由于ConsumerRecord对象可以获取到当前消息的分区与偏移量,故在log日志中将当前消息的分区与偏移量也记录下来了转载 2018-03-08 22:39:05 · 971 阅读 · 0 评论 -
Kafka学习之怎么保证不丢,不重复消费数据
Kafka作为当下流行的高并发消息中间件,大量用于数据采集,实时处理等场景,我们在享受他的高并发,高可靠时,还是不得不面对可能存在的问题,最常见的就是丢包,重发问题。丢包问题:消息推动服务,每天早上,手机上各终端都会给用户推送消息,这时候流量剧增,可能会出现kafka发送数据过快,导致服务器网卡爆满,或者磁盘处于繁忙状态,可能会出现丢包现象。 解决方案:首先对kafka进行限速,其转载 2018-03-08 22:40:36 · 3450 阅读 · 0 评论 -
kafka数据可靠性深度解读
1 概述Kakfa起初是由LinkedIn公司开发的一个分布式的消息系统,后成为Apache的一部分,它使用Scala编写,以可水平扩展和高吞吐率而被广泛使用。目前越来越多的开源分布式处理系统如Cloudera、Apache Storm、Spark等都支持与Kafka集成。Kafka凭借着自身的优势,越来越受到互联网企业的青睐,唯品会也采用Kafka作为其内部核心消息引擎之一。Kafka作为一个商业转载 2018-03-10 11:59:28 · 472 阅读 · 0 评论 -
Kafka数据可靠性与一致性解析
1.Partition Recovery机制每个Partition会在磁盘记录一个RecoveryPoint, 记录已经flush到磁盘的最大offset。当broker fail 重启时,会进行loadLogs。 首先会读取该Partition的RecoveryPoint,找到包含RecoveryPoint的segment及以后的segment, 这些segment就是可能没有 完全flush到磁转载 2018-03-10 12:05:27 · 646 阅读 · 0 评论 -
如何确定Kafka的分区数、key和consumer线程数
在Kafak中国社区的qq群中,这个问题被提及的比例是相当高的,这也是Kafka用户最常碰到的问题之一。本文结合Kafka源码试图对该问题相关的因素进行探讨。希望对大家有所帮助。怎么确定分区数? “我应该选择几个分区?”——如果你在Kafka中国社区的群里,这样的问题你会经常碰到的。不过有些遗憾的是,我们似乎并没有很权威的答案能够解答这样的问题。其实这也不奇怪,毕竟这样的问题通常都是...转载 2018-07-24 10:14:15 · 968 阅读 · 0 评论 -
如何为Kafka集群选择合适的Topic/Partitions数量
这是许多kafka使用者经常会问到的一个问题。本文的目的是介绍与本问题相关的一些重要决策因素,并提供一些简单的计算公式。越多的分区可以提供更高的吞吐量首先我们需要明白以下事实:在kafka中,单个patition是kafka并行操作的最小单元。在producer和broker端,向每一个分区写入数据是可以完全并行化的,此时,可以通过加大硬件资源的利用率来提升系统的吞吐量,例如对数据进行...转载 2018-07-24 10:32:44 · 4753 阅读 · 0 评论 -
Kafka.net使用编程入门(四)
新建一个cmd窗口,zkServer命令启动zookeeper 打开另一个cmd窗口,输入:cd D:\Worksoftware\Apachekafka2.11\bin\windowskafka-server-start D:\Worksoftware\Apachekafka2.11\config\server.properties删除主题:E:\WorkSoftWare\kafka2.11\b原创 2017-03-17 13:04:10 · 3167 阅读 · 1 评论