
kafka
文章平均质量分 69
朱智文
不求大富大贵,但求一路常青
展开
-
kafka中的topic为什么要进行分区?
若没有分区,一个topic对应的消息集在分布式集群服务组中,就会分布不均匀,即可能导致某台服务器A记录当前topic的消息集很多,若此topic的消息压力很大的情况下,服务器A就可能导致压力很大,吞吐也容易导致瓶颈。有了分区后,假设一个topic可能分为10个分区,kafka内部会根据一定的算法把10分区尽可能均匀分布到不同的服务器上,比如:A服务器负责topic的分区1,B服务器负责topi原创 2017-11-03 19:37:02 · 7436 阅读 · 2 评论 -
kafka 分区和副本以及kafaka 执行流程,以及消息的高可用
1、Kafka概览Apache下的项目Kafka(卡夫卡)是一个分布式流处理平台,它的流行是因为卡夫卡系统的设计和操作简单,能充分利用磁盘的顺序读写特性。kafka每秒钟能有百万条消息的吞吐量,因此很适合实时的数据流处理。例如kafka在线日志收集系统可作为flume的实时消息sink端,再通过kafka的消费者将消息实时写入hbase数据库中。卡夫卡以topic分类对记录进行存储原创 2017-11-03 20:00:19 · 6298 阅读 · 1 评论 -
如何保证kafka 的消息机制
1.kafka 知识总结1、kafka是什么类JMS消息队列,结合JMS中的两种模式,可以有多个消费者主动拉取数据,在JMS中只有点对点模式才有消费者主动拉取数据。kafka是一个生产-消费模型。Producer:生产者,只负责数据生产,生产者的代码可以集成到任务系统中。 数据的分发策略由producer决定,默认是defaultPartition Utils.abs(原创 2017-11-03 22:38:59 · 1344 阅读 · 0 评论 -
日志收集之--将Kafka数据导入elasticsearch
最近需要搭建一套日志监控平台,结合系统本身的特性总结一句话也就是:需要将Kafka中的数据导入到elasticsearch中。那么如何将Kafka中的数据导入到elasticsearch中去呢,总结起来大概有如下几种方式:Kafka->logstash->elasticsearch->kibana(简单,只需启动一个代理程序)Kafka->kafka-connect-elasticsear原创 2017-12-06 14:33:12 · 6865 阅读 · 0 评论 -
日志监控平台搭建 关于flume Kafka Elk
最近需要搭建一套日志监控平台,参考了新浪与美团的一些东西.现在实录一下搭建与优化调整的过程目前把这几件放在一起的文档还不够多,其中相当一部分因为elk的升级配置也已经不能用了,更多的是单机版的配置,完全没有参考性.优化的部分将等待项目与新平台正式上线在另一篇文章写出拓扑图软硬件配置本机 ubuntu 14.04线上 centos 6.5原创 2017-12-06 14:36:32 · 4997 阅读 · 0 评论