
kafka
小狼躲藏
专注于数据仓库、治理、数据分析领域
展开
-
kafka初步认识
转载:点击打开链接在我们大量使用分布式数据库、分布式计算集群的时候,是否会遇到这样的一些问题:l 我想分析一下用户行为(pageviews),以便我能设计出更好的广告位l 我想对用户的搜索关键词进行统计,分析出当前的流行趋势。这个很有意思,在经济学上有个长裙理论,就是说,如果长裙的销量高了,说明经济不景气了,因为姑娘们没钱买各种丝袜了。l 有些数据,我转载 2014-03-13 05:22:15 · 756 阅读 · 0 评论 -
Kafka实现细节(下)
转载自:点击打开链接在这一篇,我想主要写点儿kafka的存储,以及对前文kafka的分布式一些补充,kafka的应用中,分布式使用是一个很关键的主题,更好的理解producer、broker和consumer的分布式构建有利于提高系统整体的性能。这部分理论其实很简单,所以就不花大精力去写了。在上一篇中,我们说到了kafka直接使用硬盘作为存储,并且不使用内存缓存。我们还说到,之所以转载 2014-03-13 05:52:41 · 606 阅读 · 0 评论 -
Kafka实现细节(上)
摘自:点击打开链接如果你第一次看kafka的文章,请先看《分布式消息系统kafka初步》之前有人问kafka和一般的MQ之间的区别,这个问题挺难回答,我觉得不如从kafka的实现原理来分析更为透彻,这篇将依据官网上给出的design来详细的分析,kafka是如何实现其高性能、高吞吐的。这一段应该会挺长的我想分两篇来写。今天这一篇主要从宏观上说kafka实现的细节,下一篇,在从具体的转载 2014-03-13 05:48:05 · 698 阅读 · 0 评论 -
KAFKA分布式消息系统
点击打开链接Kafka[1]是linkedin用于日志处理的分布式消息队列,linkedin的日志数据容量大,但对可靠性要求不高,其日志数据主要包括用户行为(登录、浏览、点击、分享、喜欢)以及系统运行日志(CPU、内存、磁盘、网络、系统及进程状态)。 当前很多的消息队列服务提供可靠交付保证,并默认是即时消费(不适合离线)。高可靠交付对linkedin的日志不是必须的,故可通过降低可转载 2014-03-13 06:12:08 · 502 阅读 · 0 评论 -
Kafka部署与代码实例
转载自:http://shift-alt-ctrl.iteye.com/blog/1930791 kafka作为分布式日志收集或系统监控服务,我们有必要在合适的场合使用它。kafka的部署包括zookeeper环境/kafka环境,同时还需要进行一些配置操作.接下来介绍如何使用kafka. 我们使用3个zookeeper实例构建zk集群,使用2个kafka broker构建k转载 2014-03-13 06:15:32 · 1020 阅读 · 0 评论 -
Kafka分布式环境搭建
摘自:点击打开链接这篇文章将介绍如何搭建kafka环境,我们会从单机版开始,然后逐渐往分布式扩展。单机版的搭建官网上就有,比较容易实现,这里我就简单介绍下即可,而分布式的搭建官网却没有描述,我们最终的目的还是用分布式来解决问题,所以这部分会是重点。Kafka的中文文档并不多,所以我们尽量详细点儿写。要交会你搭建分布式其实很简单,手把手的教程大不了我录个视频就好了,可我觉得那不是走这转载 2014-03-13 05:35:07 · 720 阅读 · 0 评论 -
Kafka-0.10.1.0 简单安装部署
1. 下载地址: http://mirrors.tuna.tsinghua.edu.cn/apache/kafka/0.10.1.0/kafka_2.10-0.10.1.0.tgz2. 解压,配置环境变量,配置server.properties.配置项如下:broker.id=0(前面设置的本机id)port=9092host.name=10.11.111.11(本机IP)原创 2017-01-18 17:43:03 · 966 阅读 · 0 评论