互联网项目中, 一些可能有用的开源系统

本文介绍了大数据领域的关键技术和工具,包括Flume用于日志收集、Kafka作为消息队列、Storm实现实时流处理,以及Elasticsearch支持的全文检索功能,并简述了Zookeeper在分布式环境中的应用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

from:   vipshop分享。

http://www.infoq.com/cn/presentations/from-data-collection-to-massive-data-processing-and-real-time-processing?utm_source=infoq&utm_medium=videos_homepage&utm_campaign=videos_row1

flume 分布式的日志收集、聚合、传输。

kafaka linkedin开源的分布式message Q

storm,基于流的、分布式的、实时计算; 数据全在内存中。  与hadoop的区别是,hadoop数据落地到磁盘、延时大。 http://www.zhihu.com/question/20098507

ElasticSearch, 基于lucene的全文检索。 kibana, elasticSearch对应的前端api。


zookeeper, 提供分布式锁。 可用来维护全局配置信息:命名服务、配置信息等; 用做负载均衡时? 先与zookeeper通信取得可用的节点、再与节点通信实现负载均衡。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值