
分布式
文章平均质量分 82
engineer_qi
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Zookeeper简介
Zookeeper简介: 1.什么是Zookeeper? ZK是一个高效的分布式协调服务,他暴露了一些公用服务,比如命名、配置管理,同步控制,群组服务等,我们可以使用ZK实现比如达成共识,集团管理,leader选举等。 2.设计目标 简单:ZK中的namespace组织结构类似与标准的文件系统,通过这些共享的有层次的namespace来互相协调分布式...原创 2015-05-14 23:33:10 · 195 阅读 · 0 评论 -
hadoop0.20.2完全分布式安装和配置
苦一时,甜一辈子啊亲。。。刚巴德 完全分布式安装和配置 硬件环境: 虚拟机1号:master hostname: h1 IP:192.168.1.106 ==》用户名:hadoop ...原创 2015-08-15 16:27:36 · 217 阅读 · 0 评论 -
Mapreduce《案例之倒排索引》
Mapreduce《案例之倒排索引》 源数据: 1)file1: MapReduce is simple 2)file2: MapReduce is powerful is simple 3)file3: Hello MapReduce bye MapReduce 要实现的结果: 样例输出如下...原创 2015-08-15 16:36:13 · 221 阅读 · 0 评论 -
Mapreduce《案例之内连接》
Mapreduce《案例之内连接》 数据源: child parent Tom Lucy Tom Jack Jone Lucy Jone Jack Lucy Mary Lucy Ben Jack Alice Jack Jesse Terry Alice Terry Jesse Philip Terry Philip Alma Mark Terry Mark...原创 2015-08-15 16:40:41 · 330 阅读 · 0 评论 -
Mapreduce《案例之两表连接》
Mapreduce《案例之两表连接》 数据源: a.txt内容 addressed addressname 1 Beijing 2 Guangzhou 3 Shenzhen 4 Xian b.txt内容 factoryname addressed BeijingRedStar 1 ShenzhenThunder 3 GuangzhouHonda 2 Bei...原创 2015-08-15 16:44:56 · 265 阅读 · 0 评论 -
Mapreduce《案例之平均分》
Mapreduce《案例之数据排序》 数据源: a.txt 内容: aaa 120 bbb 100 ccc 130 ddd 150 b.txt内容: aaa 121 bbb 101 ccc 131 ddd 150 c.txt内容 aaa 119 bbb 99 ccc 129 ddd 150 输出结果: aaa120 bbb100 ...原创 2015-08-15 16:49:17 · 217 阅读 · 0 评论 -
Mapreduce《案例之数据去重复》
Mapreduce《案例之数据去重复》 源数据: a.txt内容: 2012-3-1 b 2012-3-2 a 2012-3-3 b 2012-3-4 d 2012-3-5 a 2012-3-6 c 2012-3-7 d 2012-3-3 c b.txt内容: 2012-3-1 a 2012-3-2 b 2012-3-3 c 2012-3-4 d 2012...原创 2015-08-25 17:16:19 · 270 阅读 · 0 评论