MapReduce 学习日志之我的MapReduce程序学习
将一批电话通信清单,记录了用户A拨打用户B的记录,需要做一个倒排索引,记录拨打给用户B的所有用户A。如原有的txt 为: 首先,我们应该把源文件传到Hdfs上,然后将原始数据进行分割,将被叫作为KEY,主叫作为Value,将拨打相同被叫的主叫号码汇总起来输出到HDFS。程序如下:package com.xxs; import java.io.IOException;im
原创
2015-11-03 21:42:48 ·
516 阅读 ·
0 评论