
kafka
文章平均质量分 76
azhao_dn
关注hadoop 数据挖掘
展开
-
消息系统Kafka介绍
作者:Dong |可以转载, 但必须以超链接形式标明文章原始出处和作者信息及版权声明网址:http://dongxicheng.org/search-engine/kafka/1、 概述Kafka是Linkedin于2010年12月份开源的消息系统,它主要用于处理活跃的流式数据。活跃的流式数据在web网站应用中非常常见,这些数据包括网站的pv、用户访问了什么内容,搜索了什么内转载 2012-06-14 18:01:55 · 2670 阅读 · 0 评论 -
kafka 介绍
1.Why we built this asd(activity stream data)数据是任何网站的一部分,反映网站使用情况,如:那些内容被搜索、展示。通常,此部分数据被以log方式记录在文件,然后定期的整合和分析。od(operation data)是关于机器性能数据,和其它不同途径整合的操作数据。 在近几年,asd和od变成一个网站重要的一部分,更复杂的基础设施是必须转载 2012-06-14 18:17:00 · 7030 阅读 · 5 评论 -
linkedin高吞吐量分布式消息系统kafka使用手记
转载自五四陈科学院[http://www.54chen.com]本文链接: http://www.54chen.com/java-ee/linkedin-kafka-usage.htmlkafka是一种高吞吐量的分布式发布订阅消息系统,她有如下特性:通过O(1)的磁盘数据结构提供消息的持久化,这种结构对于即使数以TB的消息存储也能够保持长时间的稳定性能。高吞吐量:即转载 2012-06-15 11:51:54 · 6113 阅读 · 0 评论 -
zookeeper客户端 和服务器连接时版本问题
在使用kafka 和zookeeper 实现实时分析程序时,由于zookeeper部署版本和分析程序导入jar包的版本不一致,导致了当实时分析程序从远程服务器连接kafka集群的zookeeper时报错,错误信息如下:2012-12-31 10:51:41,562-[TS] INFO main-EventThread org.I0Itec.zkclient.ZkClient - zookeep原创 2013-01-05 17:18:34 · 109349 阅读 · 8 评论