
云计算
文章平均质量分 80
Coding小飞侠
倚楼听风雨,临海看江湖——专注互联网技术!!!
展开
-
Hadoop中Pig,Hive和Hbase的区别
Pig是一种数据流语言,用来快速轻松的处理巨大的数据。当你想在你的数据上做一些转换,并且不想编写MapReduce jobs就可以用Pig.原创 2014-04-14 10:36:27 · 959 阅读 · 0 评论 -
Hdoop的核心思想
Hadoop包括两大核心,分布式存储系统和分布式计算系统。1.1.1.1. 分布式存储为什么数据需要存储在分布式的系统中哪,难道单一的计算机存储不了吗,难道现在的几个TB的硬盘装不下这些数据吗?事实上,确实装不下。比如,很多的电信通话记录就存储在很多台服务器的很多硬盘中。那么,要处理这么多数据,必须从一台一台服务器分别读取数据和写入数据,太麻烦了!我们希望有一种文件系统,可转载 2014-04-14 10:51:07 · 1337 阅读 · 0 评论 -
Hadoop安装模式
Hadoop在处理海量数据分析方面具有独天优势。今天花了在自己的Linux上搭建了伪分布模式,期间经历很多曲折,现在将经验总结如下。首先,了解Hadoop的三种安装模式:1. 单机模式. 单机模式是Hadoop的默认模。当配置文件为空时,Hadoop完全运行在本地。因为不需要与其他节点交互,单机模式就不使用HDFS,也不加载任何Hadoop的守护进程。该模式主要用于开发调试MapR转载 2014-04-16 21:03:31 · 403 阅读 · 0 评论 -
storm实时流处理介绍
今天开始接触storm,记录下Twitter将Storm正式开源了,这是一个分布式的、容错的实时计算系统,它被托管在GitHub上,遵循 Eclipse Public License 1.0。Storm是由BackType开发的实时处理系统,BackType现在已在Twitter麾下。GitHub上的最新版本是Storm 0.5.2,基本是用Clojure写的。Storm为分布式实原创 2014-04-13 09:47:12 · 1860 阅读 · 0 评论 -
海量数据处理思想
前言一般而言,标题含有“秒杀”,“99%”,“史上最全/最强”等词汇的往往都脱不了哗众取宠之嫌,但进一步来讲,如果读者读罢此文,却无任何收获,那么,我也甘愿背负这样的罪名,:-),同时,此文可以看做是对这篇文章:十道海量数据处理面试题与十个方法大总结的一般抽象性总结。毕竟受文章和理论之限,本文摒弃绝大部分的细节,只谈方法/模式论,且注重用最通俗最直白的语言阐述相关问题。最后,有一点必须强调转载 2014-05-22 17:23:48 · 629 阅读 · 0 评论