
大数据
呀呀培培
小小书童
展开
-
简析大数据的平台架构
参考文档来源:http://www.36dsj.com/archives/10223大数据的4V特征Google分布式计算的三驾马车 Google File System用来解决数据存储的问题,采用N多台廉价的电脑,使用冗余(也就是一份文件保存多份在不同的电脑之上)的方式,来取得读写速度与数据安全并存的结果。 Map-Reduce说穿了就是函数式编程,把所有的操作都分成两类,map与reduce,m转载 2016-02-18 17:20:41 · 707 阅读 · 0 评论 -
Hadoop生态上几个技术的关系与区别:hive、pig、hbase 关系与区别
参考文章来源:http://www.linuxidc.com/Linux/2014-03/98978.htm 初接触Hadoop技术的朋友肯定会对它体系下寄生的个个开源项目糊涂了,我敢保证Hive,Pig,HBase这些开源技术会把你搞的有些糊涂,不要紧糊涂的不止你一个,如某个菜鸟的帖子的疑问,when to use Hbase and when to use Hive?….请教了^_^没关系这转载 2016-02-18 17:31:14 · 383 阅读 · 0 评论