- 博客(4)
- 收藏
- 关注

原创 HBase适合做BI分析的数据源吗?
HBase是建立Hadoop File System上的一层Key-Value Pair 存储服务器。 HBase能够支持Key-Value快速插入,修改及删除,和单个Key到Value快速查询。那么Hbase适合做BI分析的数据源吗?筛选(Filtering)和聚合(Aggregation)是BI中的基本运算,所以我们首先要知道HBase是否能支持快速的筛选和聚合运算。 MapRedu
2013-01-11 19:33:55
3129

原创 大数据分析(Big Data OLAP)引擎Dremel, Tenzing 以及Impala
对于数据分析师来说,SQL是主要的语言。 Hive为Hadoop提供了支持SQL运行的能力,可是目前Hive运行速度达不到实时要求。这是因为Hive将SQL翻译成一个或多个MapReduce任务,而MapReduce原本是大数据批处理计算框架,并不适应实时数据分析的速度要求。 现在有两种思路去提高SQL在大数据平台上的执行速度: 1. 用一种更快的SQL执行引擎取代MapRed
2012-12-25 20:12:28
5136
1

原创 从谷歌(google)到Hadoop,再到大数据商业智能(Big Data BI)
从Google到Hadoop 谷歌(google)在成立公司的第一天起,就面对着大数据的问题。谷歌在大数据技术开发上,投入大量的资金和人才,其成就一直领先业界。谷歌对于核心技术也从不掩盖,积极在学术期刊上公开其大数据系统的最新进展,对业界,特别是开源社区(open source community), 起着指导作用。在过去十年里,一般是谷歌首先发表关于大数据技术的论文,然后开源社区的程序员研究并
2012-11-30 17:11:33
2666

原创 大数据(big data)究竟是什么?
“大数据”这个词最近两三年在IT界越来越热门,搞IT的如果嘴里不说起大数据,就好象是落了伍。大数据的意思不同人有不同的说法,比较实在含义是特指以Hadoop为代表的大型并发机群(Massively Parallel Processor)数据存储系统 。PB(1PB=1000TB)级在线数据(online data)存储在Hadoop里面,即被称作大数据。这几年,这个领域一直是个热门,即便在08,
2012-11-30 16:23:34
5437
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人