
Hadoop
文章平均质量分 66
erixhao
这个作者很懒,什么都没留下…
展开
-
Apache顶级项目介绍6 - Spark
火花四溢,热情洋溢。极客朋友么知道,我们翘首以盼的Spark来了。提及Spark, 这几年如日中天,谈到大数据如果不提及Spark, Hadoop,就好比这年代带耳机不是2B的,你都不好意思带。Spark最初由加州大学伯克利分校(太屌的大学,出了多少名人,名作啊)的AMPLab Matei为主的小团队使用Scala开发,其核心代码只有63个Scala文件(早期版本,这里提及一下Scala语原创 2016-05-21 01:07:20 · 17664 阅读 · 3 评论 -
Apache顶级项目介绍7 - HBase
今天我们来继续介绍Apache顶级项目大数据三巨头之一的HBase。恰逢今天(5.24)是HBase Con2016旧金山盛会,比较应景,而且还有朋友@Luke Han去演讲Kylin。1. 官网简介:老样子,HBase官网的介绍, "HBase is the Hadoop database, a distributed, scalable, big原创 2016-05-26 07:43:18 · 10085 阅读 · 5 评论 -
Apache顶级项目介绍系列1-概览
原创 2016-05-20 23:20:55 · 4783 阅读 · 0 评论 -
Apache顶级项目介绍2-Kafka
Apache顶级项目介绍系列-1,我们从Kafka说起。why?流行 + 名字cool。Kafka官网是见过比较简单,直叙的网站,“kafka是一个高吞吐的分布式的消息系统”。 Kafka最初起家于LinkedIn,当时原本作为linkedin用来管理活动流(PV,用户行为分析,搜索情况)和运营数据处理的pipline的基础。因为其分布式以及高吞吐被广泛使用,如与Clo原创 2016-05-20 23:38:36 · 3287 阅读 · 0 评论 -
Apache顶级项目介绍3 - ZooKeeper
今天介绍Apache著名顶级项目ZooKeeper,简称zk。如封面所示,管理zoo的凶猛野兽可不是简单之事。之所以先介绍zk是因为其影响力之大,范围之广,在后续的顶级项目中但凡设计分布式几乎都与其关联,所以还是及早铺垫为妙。官网介绍,zk是一个分布式的,开源的分布式应用程序协调服务,为分布式应用提供了一致性服务,核心功能包括:配置维护,命名服务,分布式同步,组服务等。前半句比原创 2016-05-20 23:57:47 · 2508 阅读 · 0 评论 -
Apache顶级项目介绍4 - Hadoop
大象起舞,天下太平,极客们应该知道我们的重量级人物Hadoop登场了。提到Hadoop, 正所谓饮水思源,我们不得不提及一下Hadoop之父,其对技术界的影响,在近10年可谓重大, 他就是Doug Cutting, 其传奇人生及其大作这里不赘述了,大家可以Google/Bing一下,之后或许我们会推出一些技术大牛的介绍以及好书推荐。值得提及的是Hadoop之原创 2016-05-21 00:16:01 · 12818 阅读 · 1 评论