有两个文件file1,file2 里面的数据如下
file1:
2016-6-1 b
2016-6-2 a
2016-6-3 b
2016-6-4 d
2016-6-5 a
2016-6-6 c
2016-6-7 d
2016-6-3 c
file2:
2016-6-1 a
2016-6-2 b
2016-6-3 c
2016-6-4 d
2016-6-5 a
2016-6-6 b
2016-6-7 c
2016-6-3 c
数据去重
在MapReduce流程中,map的输出<key,value>经过shuffle过程聚集成<key,val