linux
文章平均质量分 84
yaoyaostep
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Hadoop Tool,ToolRunner原理分析
public interface Configurable { void setConf(Configuration conf); Configuration getConf(); } Configurable接口只定义了两个方法:setConf与 getConf。 Configured类实现了Configurable接口: public class Conf转载 2013-10-11 17:01:31 · 1810 阅读 · 0 评论 -
MapReduce源码分析总结(转)
一 MapReduce概述 Map/Reduce是一个用于大规模数据处理的分布式计算模型,它最初是由Google工程师设计并实现的,Google已经将它完整的MapReduce论文公开发布了。其中对它的定义是,Map/Reduce是一个编程模型(programmingmodel),是一个用于处理和生成大规模数据集(processing and generating large dat转载 2013-11-14 17:45:55 · 788 阅读 · 0 评论 -
hadoop的datajoin
hadoop中联结不同来源数据 有时可能需要对来自不同源的数据进行综合分析: 如下例子: 有Customers文件,每个记录3个域:Custom ID, Name, Phone Number Customers Orders 1,Stephanie Leung,555-555转载 2014-02-17 15:29:18 · 664 阅读 · 0 评论
分享