接着奏乐接着舞,上文讲到大数据的四大阵营之一的 OLTP阵营,今儿开继续讲OLAP的那些事儿!
OLAP阵营主要有两大主流,
一大主流是基于MapReduce而构建的Hadoop生态圈,
另一大主流是MPP数据库阵营。不过MPP数据库通常兼具OLAP与OLTP的功能,我们把MPP数据库与OLAP类型大数据并列。
Hadoop的整体架构其实非常简单,可用计算式表达为:
Hadoop = HDFS + MapReduce
其中,HDFS负责存储,MapReduce负责计算。HDFS的设计核心理念(设计目标)有以下3个:
(1)可以扩展到数以千计的节点。
(2)假设硬件/软件的故障/失败十分普遍。
(3)一次写入,多次读写(在HDFS中,写特指文件添加操作)。
前两个比较容易理解,绝大多数的新型分布式系统都秉持类似的设计理念,特别适合于用商用硬件构建高度可扩展的高性能系统,如实现随节点数增加的线性或近线性系统性能提升。
第3个指的是Hadoop的