
kafka
空杯心态_虚怀若谷
空杯心态_虚怀若谷
展开
-
kafka基本简介
终于可以写kafka的文章了,Mina的相关文章我已经做了索引,在我的博客中置顶了,大家可以方便的找到。从这一篇开始分布式消息系统的入门。 在我们大量使用分布式数据库、分布式计算集群的时候,是否会遇到这样的一些问题: l 我想分析一下用户行为(pageviews),以便我能设计出更好的广告位 l 我想对用户的搜索关键词进行统计,分析出当前的流行趋势。这个很有意思,在经济学上有个长裙理转载 2016-07-10 14:15:19 · 208 阅读 · 0 评论 -
kafka消息可靠性问题
这里涉及两个方面,一个是消息的发送可靠性,另一个是消息的接收可靠性。一、消息发送的可靠性kafka 新版java client使用的是异步方式发送消息,即消息提交给KafkaProducer的send方法后,实际上是将该消息放入了它本身的一个后台发送队列,然后再有一个后台线程不断地从队列中取出消息进行发送,发送成功后会回调send方法的callback(如果没有,就不用回调了)。所以从以上的流程来转载 2017-03-06 17:14:26 · 928 阅读 · 0 评论 -
Kafka副本同步机制理解
Apache Kafka的流行归功于它设计和操作简单、存储系统高效、充分利用磁盘顺序读写等特性、非常适合在线日志收集等高吞吐场景。 Apache Kafka特性之一是它的复制协议。对于单个集群中每个Broker不同工作负载情况下,如何自动调优Kafka副本的工作方式是比较有挑战的。它的挑战之一是要知道如何避免follower进入和退出同步副本列表(即ISR)。从用户的角度来看,如果生产者发送转载 2017-03-06 17:59:06 · 106 阅读 · 0 评论 -
Kafka数据可靠性与一致性解析
在看本篇博客前,请先看下“ Kafka文件存储机制那些事”:http://tech.meituan.com/kafka-fs-design-theory.html 便于理解如下内容: 1.Partition Recovery机制 每个Partition会在磁盘记录一个RecoveryPoint, 记录已经flush到磁盘的最大offset。当broker fail 重启时,会进行l转载 2017-03-06 17:43:44 · 214 阅读 · 0 评论 -
Apache Kafka消息传递可靠性分析
如果MQ没有类似数据库事务结构和保证,是不可能达到消息投递100%可靠的,极端情况下消息投递要么丢失或重复。 下面咋们从producer,broker,consumer的角度分析一下Kafka中会出现哪些情况: 1.producer发送消息到Broker 目前生产者发送消息(request.required.acks)有三种方式。 acks = 0: pro转载 2017-03-06 17:28:53 · 210 阅读 · 0 评论 -
Kafka副本同步机制理解
Apache Kafka的流行归功于它设计和操作简单、存储系统高效、充分利用磁盘顺序读写等特性、非常适合在线日志收集等高吞吐场景。 Apache Kafka特性之一是它的复制协议。对于单个集群中每个Broker不同工作负载情况下,如何自动调优Kafka副本的工作方式是比较有挑战的。它的挑战之一是要知道如何避免follower进入和退出同步副本列表(即ISR)。从用户的角度来看,如果生产者发送转载 2017-03-03 22:17:15 · 272 阅读 · 0 评论 -
分布式消息系统:Kafka
原文出处: 标点符 Kafka是分布式发布-订阅消息系统。它最初由LinkedIn公司开发,之后成为Apache项目的一部分。Kafka是一个分布式的,可划分的,冗余备份的持久性的日志服务。它主要用于处理活跃的流式数据。 在大数据系统中,常常会碰到一个问题,整个大数据是由各个子系统组成,数据需要在各个子系统中高性能,低延迟的不停流转。传统的企业消息系统并不是非常适合大规模的数据处转载 2017-02-24 11:27:37 · 184 阅读 · 0 评论 -
Kafka文件的存储机制
Kafka文件的存储机制 同一个topic下有多个不同的partition,每个partition为一个目录,partition命名的规则是topic的名称加上一个序号,序号从0开始。 每一个partition目录下的文件被平均切割成大小相等(默认一个文件是500兆,可以手动去设置)的数据文件,每一个数据文件都被称为一个段(segment file),但每个段消息数量不一定转载 2017-03-02 18:04:55 · 188 阅读 · 0 评论 -
Kafka文件存储机制那些事
Kafka是什么 Kafka是最初由Linkedin公司开发,是一个分布式、分区的、多副本的、多订阅者,基于zookeeper协调的分布式日志系统(也可以当做MQ系统),常见可以用于web/nginx日志、访问日志,消息服务等等,Linkedin于2010年贡献给了Apache基金会并成为顶级开源项目。 1.前言 一个商业化消息队列的性能好坏,其文件存储机制设计是衡量一个消息队列转载 2017-03-02 18:02:59 · 115 阅读 · 0 评论 -
Kafka设计解析高可用性
Kafka在0.8以前的版本中,并不提供High Availablity机制,一旦一个或多个Broker宕机,则宕机期间其上所有Partition都无法继续提供服务。若该Broker永远不能再恢复,亦或磁盘故障,则其上数据将丢失。而Kafka的设计目标之一即是提供数据持久化,同时对于分布式系统来说,尤其当集群规模上升到一定程度后,一台或者多台机器宕机的可能性大大提高,对Failover要求非常转载 2016-09-08 20:24:22 · 187 阅读 · 0 评论 -
kafka消费者客户端
kafka客户端从kafka集群消费消息(记录)。它会透明地处理kafka集群中服务器的故障。它获取集群内数据的分区,也和服务器进行交互,允许消费者组进行负载平衡消费。(见下文)。 消费者维持TCP连接到必要的broker来获取消息。故障导致消费者关闭使用,会泄露这些连接,消费者不是线程安全的,可以查看更多关于Multi-threaded(多线程)处理的细节。转载 2017-04-18 11:14:00 · 822 阅读 · 0 评论