
34、大数据
jingqiang521
这个作者很懒,什么都没留下…
展开
-
Flume+HBase采集和存储日志数据
前言 大数据时代,谁掌握了足够的数据,谁就有可能掌握未来,而其中的数据采集就是将来的流动资产积累。 几乎任何规模企业,每时每刻也都在产生大量的数据,但这些数据如何归集、提炼始终是一个困扰。而大数据技术的意义确实不在于掌握规模庞大的数据信息,而在于对这些数据进行智能处理,从中分析和挖掘出有价值的信息,但前提是如何获取大量有价值的数据。 在最近的工作当中,本人刚好实现转载 2017-02-24 22:01:04 · 2327 阅读 · 0 评论 -
Flume+Kafka+Sparkstreaming日志分析
最近要做一个日志实时分析的应用,采用了flume+kafka+sparkstreaming框架,先搞了一个测试Demo,本文没有分析其架构原理。 简介:flume是一个分布式,高可靠,可用的海量日志聚合系统,kafka是一高吞吐量的分布式发布订阅系统,sparkstreaming是建立在spark上的实时计算框架,这这个Demo中,以上内容均为单机版伪分布,flume的source为ex转载 2017-02-24 22:07:54 · 954 阅读 · 0 评论